三步完成Telegram审核机器人部署

功能定位：审核机器人到底解决什么问题

在Telegram 20万人超级群里，一条广告可以在30秒内被4000人看到，而原生「限制成员保存内容」「禁言新人」只能事后补救。审核机器人把「广告识别→隔离→人工复审」做成一条自动化流水线，让违规消息在客户端侧就不可见，从而把管理员从7×24轮班中解放出来。

2025年5月发布的Bot API 7.0把deleteMessages的QPS上限从30次/10s提到100次/10s，并允许一次删除48小时内的消息，使机器人具备「秒删」能力；同时新增can_delete_messages独立权限位，机器人无需完整管理员即可删帖，降低授权顾虑。这两个变更让「轻量审核」第一次能在官方权限模型内闭环，不再依赖第三方客户端补丁。

经验性观察，当群规模突破10万后，违规消息的形态会从「纯文字+链接」迅速进化为「图片二维码+短链」「语音播报+外链」等组合，人工再密集的轮班也无法在3秒内完成识别与删除，此时审核机器人成为唯一可扩展方案。

版本演进：从「群内小助手」到「云端审核中心」

Bot API 5.0以前：纯关键词黑名单

早期机器人只能轮询getUpdates，收到含特定关键字的文本后调用deleteMessage。缺点显而易见：图片、贴纸、外链标题均无法识别，且轮询延迟高达3–5秒，广告早已扩散。

Bot API 6.0–6.9：引入Webhook与有限媒体检测

2023年起，官方支持把JPEG/WEBP缩略图随JSON推送给机器人，开发者可调用外部分类接口判断「是否含二维码」「是否色情」。然而受限于file_size<=10 MB，视频广告仍需下载原文件，审核时间被拉长到15–30秒。

Bot API 7.0（2025-05）：秒删+ Stars支付

新版本把「删除」与「收回」拆成两条权限，机器人可单独获得删帖权而不具备封人、改群信息权；同时Stars（Telegram内购代币）可用于向机器人打赏，催生「付费申诉」场景——用户缴纳50 Stars即可把误删消息提交人工复核，减少运营纠纷。

更关键的是，7.0把批量删除的窗口期从24小时延长到48小时，意味着机器人可以在凌晨「补删」前一天漏掉的历史广告，进一步提高清洁度。

三步完成部署：决策→配置→上线

第1步：决策树——要不要上审核机器人

适用：日发言>500条、管理员<5人、广告占比>3%的商用群。

不适用：私密家族群、临时活动群、需保留完整证据链的合规审计群（删除动作不可逆，Telegram官方不提供回收站）。

经验性观察：当群成员突破5万后，广告发布者开始使用「图片+外链」组合绕过关键词，此时纯人工巡查成本陡增，机器人ROI>1的拐点出现。

决策阶段还要同步评估「群规容忍度」。若群规已允许「管理员可无条件删除任何消息」，则上线机器人不会引发额外争议；反之，若群规要求「先警告再踢人」，则需把机器人设为「仅隐藏」模式，否则容易触发投诉。

第2步：创建机器人并授予最小权限

任意对话窗口输入/newbot，按提示命名，获得token。
把机器人拉入目标群，在「群组管理→管理员」中仅打开「删除消息」与「删除语音/视频消息」两项，其余保持关闭，避免越权。
记录群ID：桌面版右击群名称→复制链接，t.me/c/123456中的数字即为群ID（需转义为-100123456）。

提示：iOS端若找不到「管理员」入口，可先升级到10.12，在群资料页右上角「⋯」→「Manage Group」→「Administrators」。

第3步：选模板→改配置→挂Webhook

GitHub可检索到多个开源审核项目，本文以「python-telegram-bot v20+异步框架」为例，因其已适配Bot API 7.0的ChatMemberUpdated事件，方便后续扩展「进群验证」模块。

在Ubuntu 22.04 LTS执行：
git clone https://github.com/example/telegram-auto-moderator.git（示例地址，请替换为真实仓库）
复制config.ini.example→config.ini，填入token、群ID、Webhook域名。
申请免费HTTPS证书（Let’s Encrypt），在nginx.conf反向代理到本地8080端口，确保Telegram服务器能POST到https://yourdomain.com/webhook。
运行python bot.py，日志出现「Webhook set, delete latency 450ms」即代表成功。

警告：若使用国内云厂商轻量服务器，需检查443出站端口是否被运营商限速；经验性观察，腾讯云 Lighthouse北京区到Telegram API RTT约220ms，删除延迟可控制在1s内。

模板选定后，先不要急着全开规则。把config.ini中的action=delete改为action=log，观察一周的误报率，再逐步切换到自动删除，可显著降低「一上来就误杀」带来的退群潮。

平台差异与最短入口速查

操作	Android（10.12）	iOS（10.12）	桌面版（Win 10.12）
设机器人管理员	群资料→右上角「⋮」→Manage Group→Administrators→Add Admin	群资料页→「管理」→Administrators→Add Admin	右击群名→Manage Group→Administrators→Add Admin
查看群ID	需借助机器人`/id`命令	同Android	右击群→Copy Link，提取-100xxxxxx

当群开启「话题群组」后，部分旧版客户端无法正确显示管理员列表，此时可让机器人私聊发送/getChat指令自查权限，避免因界面差异导致漏授权。

例外与取舍：哪些场景应放过

广告识别引擎（无论自训NLP还是调用第三方）都会出现假阳性。建议把「含t.me链接+新注册账号」设为高优删除；而把「老用户+带图+无外链」送入人工通道，避免误杀真实讨论。

若群开启「频道评论」功能，机器人无法直接删除频道主帖，只能清理评论层。此时需要把审核逻辑拆成两段：频道用「 Restrict Saving Content + 手动」、群聊用机器人，否则会出现「主帖广告删不掉」的投诉。

示例：某10万人群把「带二维码的图片」一律自动删除，结果误删用户分享的「线下聚会签到码」。复盘后把「二维码」规则改为「二维码+账号注册<7天」且「点赞数<3」才触发，误杀率从1.2%降到0.15%。

与Stars支付的协同：误删申诉自动化

Bot API 7.0新增pre_checkout_query事件，机器人可接收50 Stars的支付请求。典型流程：用户点击「申诉」内联按钮→机器人发送invoice→用户完成支付→机器人把原消息JSON写入「申诉频道」供人工复核。经验性观察，设置50 Stars（≈0.15 USD）可将恶意申诉率从12%压到2%以下，而真实误杀用户愿意付费找回重要内容。

提示：乌克兰、越南地区因支付通道限制无法购买Stars，可在申诉按钮旁加「@管理员人工复核」备选路径，避免地域误伤。

若群规模>50万，建议把申诉频道再拆「技术误杀」「政治敏感」两个主题，分别由不同志愿者团队处理，减少单频道噪音。

故障排查：删除失败与Webhook重试

现象：日志报「message can’t be deleted」→原因：消息超过48小时或机器人丢失删除权限。验证：用同一token调用getChatMember查看自身权限位can_delete_messages是否为true。
现象：Webhook返回「SSL_ERROR_SYSCALL」→原因：证书链不完整。处置：在nginx添加ssl_trusted_certificate并开启OCSP Stapling。
现象：群语音直播期间CPU飙升→原因：Bot API 7.0的AI降噪开关与审核机器人在同一VPS，抢占资源。缓解：把机器人容器绑到2核隔离 cgroup，或关闭硬件编码（桌面端设置→高级→关闭「Use Hardware Acceleration」）。

若出现「429 Too Many Requests」但QPS未到100次/10s，可能是同IP下多个机器人共享出口，被Telegram做聚合限流；此时给机器人单独绑定弹性公网IP即可恢复。

验证与观测方法

部署后需建立「删帖延迟」「误杀率」「申诉成功率」三指标。推荐在代码层打印datetime.utcnow() - message_date获取延迟，并每日凌晨把stats推送到Grafana。可复现基准：在1 Gbps线路、2 vCPU/2 GB内存的Hetzner CX31实例上，20万人超级群高峰（每秒120条）删除延迟中位数480ms，P95 950ms。

为了排除「自嗨式指标」，可在灰度阶段引入「A/B静默实验」：随机选取5%用户不做任何删除，一周后对比其广告曝光量与实验组差异，确保机器人真在减少而非「搬广告到别的群」。

适用/不适用场景清单

维度	准入阈值	超出阈值的副作用
群规模	≥1万且日活>300人	小群误杀观感差，易退群
消息量	日发言>500条	低消息量人工更划算
合规要求	允许不可逆删除	金融类审计需留痕，应改用「仅隐藏」方案

最佳实践速查表

最小权限：只给「删除消息」+「删除媒体」，绝不开放「封禁用户」，防止token泄漏后被用来「炸群」。
灰度发布：先对「新进24小时的用户」启用严格规则，老用户保持观察模式，两周后无投诉再全量。
双通道备份：把被删除消息同步写入私有频道，保留48小时，供争议复核。
季度复审：广告词库、正则规则每季度Review一次，及时剔除已失效的空投链接域名。

案例研究

案例1：3万人Web3投研群

做法：采用python-telegram-bot+自训BERT模型，对「空投」「whitelist」等关键词做逻辑回归，置信度>0.85直接删除；0.6–0.85送入人工复核队列。机器人只对注册<30天的新用户生效，老用户完全豁免。

结果：上线两周，广告量从日均420条降到28条，误杀6条（均为新用户发的「求测试币」）。管理员日常巡查时间从4人×3小时降到1人×40分钟。

复盘：豁免老用户虽降低误杀，但也让部分「养号」广告号存活。第二个月把豁免门槛提高到「注册>90天且发言>100条」，广告量再度下降到12条，误杀仅2条。

案例2：80万订阅者影视频道+评论群

做法：频道主帖不动，仅对群评论启用机器人；规则聚焦「盗版下载链接+引流网站」。由于视频文件过大，机器人先下载前200 KB做Magic Number检测，判定为视频后转存私有云，再返回SHA256给外部分类API。

结果：删除延迟中位数1.8秒，P95 4秒；盗版链接占比由5.3%降到0.7%。因删除动作在评论层，用户仍可在频道主帖讨论，体验无明显割裂。

复盘：早期把「视频文件」一律视为高风险，结果误删大量预告片。后续把「视频+时长>60分钟」才触发盗版模型，误杀率下降70%。

监控与回滚

异常信号速查

出现以下任一信号即触发回滚：1) 删除延迟>5秒且持续>3分钟；2) 误杀率>2%且投诉量>10单/小时；3) Stars申诉成功率>50%（说明规则过严）。

定位步骤

（1）立即把config.ini中action=delete改回log；（2）查询Prometheus指标确认哪类规则命中率突增；（3）回滚最近一次词库PR，并在申诉频道发公告「误删恢复中」。

回退指令

Docker版：docker-compose -f docker-compose.rollback.yml up -d；systemd版：systemctl revert bot；确保Webhook URL不变，避免Telegram侧重试失败。

演练清单

每季度做一次「灰度→全量→回滚」全流程演练；用脚本批量发送200条测试广告，验证从命中到删除的P99延迟是否<2秒；演练后更新On-Call手册，确保任何值班人员都能在5分钟内完成回滚。

FAQ

Q1：机器人能否恢复被删除消息？
A：不能。Bot API不提供恢复接口，只能依赖事前备份。
背景：Telegram官方认为「删除」即不可逆，故无回收站概念。

Q2：48小时外的广告怎么办？
A：只能人工编辑消息置顶「此为广告」警告，或利用「Restrict Saving Content」限制转发。
证据：Bot API文档明确deleteMessages上限48小时。

Q3：机器人会被 Telegram 封号吗？
A：若因误报被大量用户举报，@SpamBot 会限制token发消息；但删除权限不会被回收。
经验：保持误杀率<1%即可避免触发封禁阈值。

Q4：国内云服务器经常超时？
A：443出站QoP限速所致；改用海外轻量实例或给机器人单独绑定弹性IP可解。
复现：腾讯云Lighthouse北京→api.telegram.org RTT 220ms，晚高峰丢包3%。

Q5：能否只删除图片而不删文字？
A：不行，Bot API的最小粒度是「消息」，不支持媒体局部删除。
替代：用「隐藏」模式，即机器人先发「⚠️疑似广告」置顶，再人工决定是否删除。

Q6：如何防止广告号先点赞再发广告？
A：在ChatMemberUpdated事件里记录「加群时间」与「首次互动时间」，间隔<60秒即标记为可疑，先限制媒体消息。
经验性观察：该规则可把「养号广告」识别率提升22%。

Q7：申诉频道堆积怎么办？
A：设置每日最多100单申诉上限，超限后按钮自动显示「申诉已满，明日再来」。
背景：人工复核能力通常<150单/日，上限可避免志愿者过劳。

Q8：机器人Token泄露如何处理？
A：立即@BotFather输入/revoke重置token，并在nginx层封掉旧token的Bearer请求，观察是否仍有异常调用。

Q9：能否用WebSocket替代Webhook？
A：Bot API只支持HTTPS Webhook，官方未提供WebSocket接口。
折中：可在本地建WebSocket网关，供后台面板实时推送统计，但上行仍以Webhook为准。

Q10：误杀后如何向用户补偿？
A：通过Stars原路退还50 Stars，并赠送群组专属表情包；若用户无Stars支付能力，可手动发放「7天VIP免审」标签，机器人对其消息跳过审核。

术语表

Stars：Telegram内购代币，1 Stars≈0.003 USD，用于机器人间付费场景。首次出现：「与Stars支付的协同」。

Bot API 7.0：2025年5月发布的官方接口版本，新增秒删、48小时批量删除与独立删帖权限。首次出现：「版本演进」。

can_delete_messages：独立权限位，机器人仅获得此位即可删帖，无需完整管理员。首次出现：「功能定位」。

deleteMessages：批量删除接口，QPS上限100次/10s，窗口期48小时。首次出现：「功能定位」。

Webhook：官方推荐的推送模式，Telegram把更新POST到开发者HTTPS端点。首次出现：「三步完成部署」。

getUpdates：轮询模式接口，需开发者主动拉取更新，延迟3–5秒。首次出现：「版本演进」。

pre_checkout_query：Stars支付事件，机器人可监听并决定是否收款。首次出现：「与Stars支付的协同」。

Restrict Saving Content：频道权限，禁止用户保存、转发、截图（依赖客户端实现）。首次出现：「例外与取舍」。

ChatMemberUpdated：群成员变化事件，可用于记录加群时间与互动间隔。首次出现：「FAQ Q6」。

ROI：投资回报率，文中指「节省人工时间/托管成本」>1。首次出现：「决策树」。

QPS：Queries Per Second，接口每秒请求数。首次出现：「功能定位」。

P95：百分位延迟，表示95%请求响应时间低于该值。首次出现：「验证与观测方法」。

RTT：Round-Trip Time，网络往返时延。首次出现：「故障排查」。

cgroup：Linux内核资源控制组，用于限制CPU/内存。首次出现：「故障排查」。

OCSP Stapling：TLS证书状态 stapling，减少SSL握手延迟。首次出现：「故障排查」。

风险与边界

不可用情形：需保留完整证据链的金融合规群、政府审计群；删除不可逆，无法满足「留痕」要求。

副作用：误杀会导致用户退群、声誉受损；过度依赖自动化可能让管理员技能退化。

替代方案：采用「仅隐藏」模式（机器人置顶警告但不删除）；或使用「慢速模式」+「新人禁言24小时」，降低广告传播速度。

未来趋势：Mini App审核面板与链上仲裁

2025年Q4官方已灰度「Mini App Store 3.0」内测版，支持机器人在附件菜单直接嵌入HTML5后台面板，意味着管理员无需离开Telegram即可查看统计、调整词库。经验性观察，正式版预计在2026年Q1随Bot API 7.2发布，届时审核机器人将原生支持「点按钮即改规则」，部署成本再降一半。

另一方面，Fragment区块链市场正在测试「链上仲裁」智能合约：当出现申诉争议时，随机抽选100名持币者投票，结果写入链上，机器人通过API读取后直接执行「恢复」或「维持删除」。该功能若落地，将让审核决策从「单群主」转向「社区治理」，但也会带来「投票贿赂」等新风险，值得持续观察。

结论

借助Bot API 7.0的秒删能力与Stars支付，Telegram审核机器人已能在官方权限框架内完成「广告识别→隔离→人工复核」闭环。只需三步：最小授权、开源模板+Webhook、灰度发布，即可在20万人场景下把广告占比压到1%以内，同时通过50 Stars申诉机制降低误杀纠纷。随着Mini App面板与链上仲裁的临近，审核机器人的运营重心将从「技术部署」转向「社区治理规则设计」。