跳到主要內容

AI 模型的「指令遵循性」的重要性

很多人可能不太懂,為什麼我老是強調 AI 模型的「指令遵循性」(Instruction Following)有多重要。昨天剛好發生了一件血淋淋的慘案,決定寫下來作為證明。

因為我有訂閱 Google AI Pro,每天 Antigravity 的 Token 點數不用白不用,昨天閒著沒事,就叫它用 Gemini 3 Flash 幫我把手上一個舊專案補上註解。我的指令非常簡單,只有三條: 

  1. 只加繁體中文註解;如果原本就有繁中註解,請不要動它。
  2. 遇到英文註解,請翻譯成繁體中文。
  3. 嚴禁修改任何程式碼。
剛開始一切正常,結果跑到一個義大利麵式 、長達 3000 行的程式檔時,AI 就開始暴走了。它不只把註解改得「更漂亮」,後來甚至看參數名稱不順眼,直接幫我重新命名。這也就算了,最後最扯的是,它竟然覺得有些邏輯寫得不對,擅自改動了幾行程式碼!

如果我沒人工核對就直接 Push 到 Git,之後大概會修 Bug 修到懷疑人生。所以說,指令遵循性真的太關鍵了——只有聽得懂人話、乖乖守規矩的模型,在呼叫 Tool 或 Agent 時才會精準,產出真正可用的結果。

在地端執行的小模型 8B ~ 12B,多半都敗在指令遵循性,而不是不夠聰明。就算是 gpt-oss:120b,遇到這個任務的第一反應居然是直接偷懶,寫一個 python 程式唬爛加一句「此註解由AI自動產生」呼弄過去。而 qwen3-coder:30b 在此任務也會常出問題,無法正確地修改註解。 
因此,選擇模型時,我的第一個標準是夠聰明,第二個標準即是指令遵循性要高。

留言

這個網誌中的熱門文章

DBeaver 介面語言

DBeaver是我個人頗常用的一套跨平台Database管理工具,最近升級後發現Windows版本居然變成簡體中文,而且無法切換為英文。

自然人憑證讀卡機驅動程式

鳥毅用的是第一代的自然人憑證讀卡機,EZ100PU(後來有同事買EZmini可以讀SIM卡似乎更好),每年報稅時用一次。 本來只是要申請些政府業務,一時之間找不到光碟,沒想到在 驅動程式下載 居然看到Linux和Mac的驅動程式,剩下的就是政府單位的網頁和程式應該改版了吧!!!

如何將較高版本SQL Server複製到低版本SQL Server (降級為舊版)並保留權限及資料庫圖表

一般若是要將SQL Server裡的Database轉往其他Server時,最簡單的方式就是備份(Backup)後再還原(Restore),或者是䣃離(detach)後附加(attach)。 但是很不幸地,若是由較低版本(e.g. 2008)到較高版本(e.g. 2012)要怎麼辦呢?