img
李建興

OpenAI與Paradigm合推基準測試EVMbench,評測AI代理智慧合約漏洞攻防能力

新聞 OpenAI宣布與加密資產投資機構Paradigm合作推出EVMbench,這套基準測試用來衡量AI代理在以太坊虛擬機(EVM)環境下,面對高嚴重性智慧合約漏洞時,能否完成偵測、修補與利用等任務。 OpenAI指出,許多以開源程式碼形式部署的智慧合約長期管理大量加密資產,隨著AI系統越來越擅長閱讀、撰寫與執行程式碼,產業需要在更貼近經濟誘因與實務流程的環境中量測模型能力,並推動防禦性應用,用於稽核與強化既有合約。 EVMbench收集120個經過整理的漏洞案例,來源涵蓋40次稽核成果,多數取自開放…