跳到主要內容

AI 模型的「指令遵循性」的重要性

很多人可能不太懂,為什麼我老是強調 AI 模型的「指令遵循性」(Instruction Following)有多重要。昨天剛好發生了一件血淋淋的慘案,決定寫下來作為證明。

因為我有訂閱 Google AI Pro,每天 Antigravity 的 Token 點數不用白不用,昨天閒著沒事,就叫它用 Gemini 3 Flash 幫我把手上一個舊專案補上註解。我的指令非常簡單,只有三條: 

  1. 只加繁體中文註解;如果原本就有繁中註解,請不要動它。
  2. 遇到英文註解,請翻譯成繁體中文。
  3. 嚴禁修改任何程式碼。
剛開始一切正常,結果跑到一個義大利麵式 、長達 3000 行的程式檔時,AI 就開始暴走了。它不只把註解改得「更漂亮」,後來甚至看參數名稱不順眼,直接幫我重新命名。這也就算了,最後最扯的是,它竟然覺得有些邏輯寫得不對,擅自改動了幾行程式碼!

如果我沒人工核對就直接 Push 到 Git,之後大概會修 Bug 修到懷疑人生。所以說,指令遵循性真的太關鍵了——只有聽得懂人話、乖乖守規矩的模型,在呼叫 Tool 或 Agent 時才會精準,產出真正可用的結果。

在地端執行的小模型 8B ~ 12B,多半都敗在指令遵循性,而不是不夠聰明。就算是 gpt-oss:120b,遇到這個任務的第一反應居然是直接偷懶,寫一個 python 程式唬爛加一句「此註解由AI自動產生」呼弄過去。而 qwen3-coder:30b 在此任務也會常出問題,無法正確地修改註解。 
因此,選擇模型時,我的第一個標準是夠聰明,第二個標準即是指令遵循性要高。

留言

這個網誌中的熱門文章

DBeaver 介面語言

DBeaver是我個人頗常用的一套跨平台Database管理工具,最近升級後發現Windows版本居然變成簡體中文,而且無法切換為英文。

自然人憑證讀卡機驅動程式

鳥毅用的是第一代的自然人憑證讀卡機,EZ100PU(後來有同事買EZmini可以讀SIM卡似乎更好),每年報稅時用一次。 本來只是要申請些政府業務,一時之間找不到光碟,沒想到在 驅動程式下載 居然看到Linux和Mac的驅動程式,剩下的就是政府單位的網頁和程式應該改版了吧!!!

Personal Bookmark

Java SE 6 + Firefox 2 UI 問題 As I do . Google拋棄了了SOAP API,浮想聯翩 https://www.gandi.net/ VS 2005 SP1中文版推出 Windows Vista中文版下載 ASP.NET 2.0網頁執行管線與快取原理 Cache 2.0快取架構與快取資料自動移除架構圖 flickr sync 分享與試用 SUN Looking Glass 3D圖形介面發布1.0 雅虎勵精圖治推動改革 Wait and see 國內某SOC疑遭駭客入侵 大砲開講 Very Important! 微軟公佈Vista安全程式介面草案 一窺Google開原碼庫房乾坤 qing is writing a dig girl net... wait and see