AI 是不是偷偷變笨了?AIStupidLevel:24 小時監測 AI 模型退化的評測網站
這篇來聊一個叫做 AIStupidLevel 的評測網站,它 24 小時盯著 OpenAI、Anthropic、Google、xAI、DeepSeek、Kimi、GLM 共 7 家供應商旗下 21 個現役 AI 模型,每隔幾小時就丟一批編碼題、推理題、工具呼叫任務給它們跑,再用 5 次取中位數 + 95% 信心區間打分數,搭配 CUSUM 變點偵測演算法揪出模型有沒有偷偷變笨。文中會講為什麼 AI 會變笨(無聲更新、量化)、它的四種測試怎麼跑、Stupid Meter 分數怎麼看、怎麼拿自己的 API Key 測,以及附帶的 Smart Router 自動選模型功能。