法國AI新創Mistral發布編碼模型Codestral:開發者新助手?

Featured Image
法國人工智慧初創公司Mistral最近推出了第一款由微軟支持並估值600萬美元的生成式AI模型Codestral,專為開發人員編寫和互動代碼而設計。Mistral在一篇博客文章中解釋說,Codestral訓練了80多種編程語言,包括Python、Java、C++和JavaScript。Codestral可以完成編碼功能、編寫測試和填寫部分代碼,並能以英語回答有關代碼庫的問題。Mistral將該模型描述為「開放式」,但這一點還有待商榷。該初創公司的許可證禁止將Codestral及其輸出用於「任何」商業活動。其中有一項例外是「開發」,但即使如此,該許可證還明確禁止「在公司業務活動的背景下,員工進行任何內部使用」。原因可能是Codestral在訓練過程中部分使用了受版權保護的內容。Mistral在博客文章中沒有證實或否認這一點,但這並不令人驚訝;有消息稱該初創公司以前的訓練數據集中包含受版權保護的數據。無論如何,Codestral可能不值得去麻煩。該模型擁有220億個參數,需要一台強大的個人電腦才能運行。(參數基本上定義了AI模型在解決問題(如分析和生成文本)方面的能力。)而且,儘管在某些基準測試中超越了一些競爭對手(正如我們所知道的那樣,這些基準測試往往有其局限性),但其性能改進幅度並不明顯。儘管大多數開發人員不太可能使用Codestral,並且在性能改進方面進展有限,但它無疑會引發一場關於是否明智依靠生成代碼模型作為編程助手的辯論。開發人員確實在部分編程任務中積極使用生成式AI工具。根據2023年6月的Stack Overflow調查,44%的開發人員表示他們現在在開發過程中使用AI工具,而26%的開發人員計劃很快使用。然而,這些工具也有明顯的缺陷。根據GitClear對過去幾年提交到項目存儲庫的超過1.5億行代碼的分析,生成式AI開發工具導致了更多錯誤被推送到代碼庫中。此外,安全研究人員警告稱,這些工具可能會放大軟件項目中現有的錯誤和安全漏洞;根據一項研究,OpenAI對編程問題的回答中有一半是錯誤的。但這並不會阻止像Mistral等公司試圖通過其模型實現商業化(並獲得市場份額)。今天,Mistral在其Le Chat對話式AI平台以及付費API上推出了Codestral的托管版本。Mistral表示,他們還努力將Codestral集成到應用程序框架和開發環境中,例如LlamaIndex、LangChain、Continue.dev和Tabnine。

(文章已經進行了微調和優化)

Share this content: