Fly.io 部署

目标:Fly.io 机器上运行 OpenClaw Gateway,配置持久化存储、自动 HTTPS 和 Discord/Channel 访问。

你需要准备

  • 安装 flyctl CLI
  • Fly.io 账号(免费套餐就行)
  • 模型认证:Anthropic API key(或其他提供商的密钥)
  • Channel 凭证:Discord bot token、Telegram token 等

新手快速上手

  1. 克隆仓库 → 自定义 fly.toml
  2. 创建应用 + 存储卷 → 设置密钥
  3. fly deploy 部署
  4. SSH 进去创建配置文件,或使用 Control UI

1) 创建 Fly 应用

# 克隆仓库
git clone https://github.com/openclaw/openclaw.git
cd openclaw

# 创建新的 Fly 应用(自己取个名字)
fly apps create my-openclaw

# 创建持久化存储卷(1GB 通常够用)
fly volumes create openclaw_data --size 1 --region iad

提示: 选择离你近的区域。常用选项:lhr(伦敦)、iad(弗吉尼亚)、sjc(圣何塞)。

2) 配置 fly.toml

编辑 fly.toml 来匹配你的应用名称和需求。

安全提示: 默认配置会暴露公开 URL。如果要加固部署且不使用公网 IP,参考私有部署(加固)或使用 fly.private.toml

app = "my-openclaw"  # 你的应用名称
primary_region = "iad"

[build]
  dockerfile = "Dockerfile"

[env]
  NODE_ENV = "production"
  OPENCLAW_PREFER_PNPM = "1"
  OPENCLAW_STATE_DIR = "/data"
  NODE_OPTIONS = "--max-old-space-size=1536"

[processes]
  app = "node dist/index.js gateway --allow-unconfigured --port 3000 --bind lan"

[http_service]
  internal_port = 3000
  force_https = true
  auto_stop_machines = false
  auto_start_machines = true
  min_machines_running = 1
  processes = ["app"]

[[vm]]
  size = "shared-cpu-2x"
  memory = "2048mb"

[mounts]
  source = "openclaw_data"
  destination = "/data"

关键设置:

设置原因
--bind lan绑定到 0.0.0.0,这样 Fly 的代理才能访问 Gateway
--allow-unconfigured无配置文件也能启动(稍后再创建配置)
internal_port = 3000必须匹配 --port 3000(或 OPENCLAW_GATEWAY_PORT),用于 Fly 健康检查
memory = "2048mb"512MB 太小;推荐 2GB
OPENCLAW_STATE_DIR = "/data"在存储卷上持久化状态

3) 设置密钥

# 必需:Gateway token(用于非本地回环绑定)
fly secrets set OPENCLAW_GATEWAY_TOKEN=$(openssl rand -hex 32)

# 模型提供商 API 密钥
fly secrets set ANTHROPIC_API_KEY=sk-ant-...

# 可选:其他提供商
fly secrets set OPENAI_API_KEY=sk-...
fly secrets set GOOGLE_API_KEY=...

# Channel tokens
fly secrets set DISCORD_BOT_TOKEN=MTQ...

注意:

  • 非本地回环绑定(--bind lan)需要 OPENCLAW_GATEWAY_TOKEN 来保证安全。
  • 把这些 token 当密码一样对待。
  • 优先用环境变量而不是配置文件 来存储所有 API 密钥和 token。这样可以避免密钥出现在 openclaw.json 中被意外暴露或记录。

4) 部署

fly deploy

首次部署会构建 Docker 镜像(约 2-3 分钟)。后续部署会更快。

部署后,验证一下:

fly status
fly logs

你应该能看到:

[gateway] listening on ws://0.0.0.0:3000 (PID xxx)
[discord] logged in to discord as xxx

5) 创建配置文件

SSH 进入机器来创建正式配置:

fly ssh console

创建配置目录和文件:

mkdir -p /data
cat > /data/openclaw.json << 'EOF'
{
  "agents": {
    "defaults": {
      "model": {
        "primary": "anthropic/claude-opus-4-5",
        "fallbacks": ["anthropic/claude-sonnet-4-5", "openai/gpt-4o"]
      },
      "maxConcurrent": 4
    },
    "list": [
      {
        "id": "main",
        "default": true
      }
    ]
  },
  "auth": {
    "profiles": {
      "anthropic:default": { "mode": "token", "provider": "anthropic" },
      "openai:default": { "mode": "token", "provider": "openai" }
    }
  },
  "bindings": [
    {
      "agentId": "main",
      "match": { "channel": "discord" }
    }
  ],
  "channels": {
    "discord": {
      "enabled": true,
      "groupPolicy": "allowlist",
      "guilds": {
        "YOUR_GUILD_ID": {
          "channels": { "general": { "allow": true } },
          "requireMention": false
        }
      }
    }
  },
  "gateway": {
    "mode": "local",
    "bind": "auto"
  },
  "meta": {
    "lastTouchedVersion": "2026.1.29"
  }
}
EOF

注意: 设置了 OPENCLAW_STATE_DIR=/data 后,配置文件路径就是 /data/openclaw.json

注意: Discord token 可以来自以下任一方式:

  • 环境变量:DISCORD_BOT_TOKEN(推荐用于密钥)
  • 配置文件:channels.discord.token

如果用环境变量,就不需要在配置文件里加 token。Gateway 会自动读取 DISCORD_BOT_TOKEN

重启来应用配置:

exit
fly machine restart <machine-id>

6) 访问 Gateway

Control UI

在浏览器中打开:

fly open

或访问 https://my-openclaw.fly.dev/

粘贴你的 Gateway token(就是 OPENCLAW_GATEWAY_TOKEN 那个)来认证。

日志

fly logs              # 实时日志
fly logs --no-tail    # 最近的日志

SSH 控制台

fly ssh console

故障排除

”App is not listening on expected address”

Gateway 绑定到了 127.0.0.1 而不是 0.0.0.0

解决方法:fly.toml 的进程命令中添加 --bind lan

健康检查失败 / 连接被拒绝

Fly 无法在配置的端口上访问 Gateway。

解决方法: 确保 internal_port 匹配 Gateway 端口(设置 --port 3000OPENCLAW_GATEWAY_PORT=3000)。

OOM / 内存问题

容器不断重启或被杀掉。迹象:SIGABRTv8::internal::Runtime_AllocateInYoungGeneration 或静默重启。

解决方法:fly.toml 中增加内存:

[[vm]]
  memory = "2048mb"

或更新现有机器:

fly machine update <machine-id> --vm-memory 2048 -y

注意: 512MB 太小。1GB 可能能用但在负载或详细日志下可能 OOM。推荐 2GB。

Gateway 锁问题

Gateway 拒绝启动,报”已在运行”错误。

这发生在容器重启但 PID 锁文件仍保留在存储卷上时。

解决方法: 删除锁文件:

fly ssh console --command "rm -f /data/gateway.*.lock"
fly machine restart <machine-id>

锁文件在 /data/gateway.*.lock(不在子目录中)。

配置文件未被读取

如果使用 --allow-unconfigured,Gateway 会创建一个最小配置。你在 /data/openclaw.json 的自定义配置应该在重启后被读取。

验证配置文件是否存在:

fly ssh console --command "cat /data/openclaw.json"

通过 SSH 写入配置

fly ssh console -C 命令不支持 shell 重定向。要写入配置文件:

# 使用 echo + tee(从本地管道到远程)
echo '{"your":"config"}' | fly ssh console -C "tee /data/openclaw.json"

# 或使用 sftp
fly sftp shell
> put /local/path/config.json /data/openclaw.json

注意: 如果文件已存在,fly sftp 可能会失败。先删除:

fly ssh console --command "rm /data/openclaw.json"

状态未持久化

如果重启后丢失凭证或会话,说明状态目录写入到了容器文件系统。

解决方法: 确保在 fly.toml 中设置了 OPENCLAW_STATE_DIR=/data 并重新部署。

更新

# 拉取最新更改
git pull

# 重新部署
fly deploy

# 检查健康状态
fly status
fly logs

更新机器命令

如果需要在不完全重新部署的情况下更改启动命令:

# 获取机器 ID
fly machines list

# 更新命令
fly machine update <machine-id> --command "node dist/index.js gateway --port 3000 --bind lan" -y

# 或同时增加内存
fly machine update <machine-id> --vm-memory 2048 --command "node dist/index.js gateway --port 3000 --bind lan" -y

注意: fly deploy 后,机器命令可能会重置为 fly.toml 中的内容。如果你手动做了更改,在部署后需要重新应用。

私有部署(加固)

默认情况下,Fly 会分配公网 IP,让你的 Gateway 可以通过 https://your-app.fly.dev 访问。这很方便,但意味着你的部署会被互联网扫描器(Shodan、Censys 等)发现。

要实现无公网暴露的加固部署,使用私有模板。

何时使用私有部署

  • 你只进行出站调用/消息(无入站 webhook)
  • 你使用 ngrok 或 Tailscale 隧道来处理任何 webhook 回调
  • 你通过 SSH、代理或 WireGuard 而不是浏览器访问 Gateway
  • 你希望部署对互联网扫描器隐藏

设置

使用 fly.private.toml 而不是标准配置:

# 使用私有配置部署
fly deploy -c fly.private.toml

或转换现有部署:

# 列出当前 IP
fly ips list -a my-openclaw

# 释放公网 IP
fly ips release <public-ipv4> -a my-openclaw
fly ips release <public-ipv6> -a my-openclaw

# 切换到私有配置,这样未来的部署不会重新分配公网 IP
#(移除 [http_service] 或使用私有模板部署)
fly deploy -c fly.private.toml

# 分配仅私有的 IPv6
fly ips allocate-v6 --private -a my-openclaw

之后,fly ips list 应该只显示 private 类型的 IP:

VERSION  IP                   TYPE             REGION
v6       fdaa:x:x:x:x::x      private          global

访问私有部署

由于没有公网 URL,使用以下方法之一:

选项 1:本地代理(最简单)

# 将本地端口 3000 转发到应用
fly proxy 3000:3000 -a my-openclaw

# 然后在浏览器中打开 http://localhost:3000

选项 2:WireGuard VPN

# 创建 WireGuard 配置(一次性)
fly wireguard create

# 导入到 WireGuard 客户端,然后通过内部 IPv6 访问
# 示例:http://[fdaa:x:x:x:x::x]:3000

选项 3:仅 SSH

fly ssh console -a my-openclaw

私有部署的 Webhook

如果你需要 webhook 回调(Twilio、Telnyx 等)但不想公网暴露:

  1. ngrok 隧道 - 在容器内或作为 sidecar 运行 ngrok
  2. Tailscale Funnel - 通过 Tailscale 暴露特定路径
  3. 仅出站 - 某些提供商(Twilio)在没有 webhook 的情况下也能正常进行出站呼叫

使用 ngrok 的语音通话配置示例:

{
  "plugins": {
    "entries": {
      "voice-call": {
        "enabled": true,
        "config": {
          "provider": "twilio",
          "tunnel": { "provider": "ngrok" }
        }
      }
    }
  }
}

ngrok 隧道在容器内运行,提供公开的 webhook URL,而不暴露 Fly 应用本身。

安全优势

方面公开部署私有部署
互联网扫描器可被发现隐藏
直接攻击可能被阻止
Control UI 访问浏览器代理/VPN
Webhook 传递直接通过隧道

注意事项

  • Fly.io 使用 x86 架构(不是 ARM)
  • Dockerfile 兼容两种架构
  • 对于 WhatsApp/Telegram 引导,使用 fly ssh console
  • 持久化数据存储在 /data 的存储卷上
  • Signal 需要 Java + signal-cli;使用自定义镜像并保持内存在 2GB+。

成本

使用推荐配置(shared-cpu-2x,2GB RAM):

  • 每月约 $10-15,取决于使用量
  • 免费套餐包含一些额度

详情参见 Fly.io 定价