top of page
作家相片Elite Cloud

Claude 3 – 更快、更便宜、更聰明?

人工智慧(AI)目前是數位轉型的核心力量,正在重新塑造各行各業,並徹底改變我們的生活與工作方式。在這個領域中,AI 助理是最值得注意的發展之一 – 智能系統能夠理解自然語言、回答問題,並以前所未有的效率執行各種任務。


我們已經見證了 OpenAI 的 ChatGPT、Google 的 Gemini,以及其他眾多 AI 助理的問世。每款 AI 助理都有各自的優勢與劣勢。在這場 AI 競賽中,Anthropic 推出了其最新的 AI 助理 Claude 3,在性能上超越了競爭對手 GPT 3.5、GPT 4.0 和 Google Gemini。


Comparison chart between ai's

資料來源:Anthropic


什麼是 Claude 3?

Claude 3 於 2024 年 3 月 4 日發布,提供了三款不同的 AI 模型:Haiku、Sonnet 和 Opus,能力從低到高依次排列。


它支援一般對話,並具有分析圖像和文件的能力。


目前,Sonnet 和 Opus 模型可在 claude.ai 和 Claude API 上使用。然而,Opus 模型需要支付 $20/月的訂閱費,類似於 GPT-4。而 Claude 3 Haiku 模型則可通過 Amazon Bedrock 使用。


Claude 3 模型具備先進的多模態能力,可以處理和分析文字與圖像,使其成為從一般對話到執行複雜內容創作任務等多種應用的多功能工具。這些模型設計為高度互動性,能夠在各種領域中生成高品質內容。


Model details模型詳情

以下是 Claude 3 提供的三款模型、其能力與定價的詳細說明:


Opus

Opus 是最智能且最昂貴的模型。它可以執行複雜任務、問題解決與分析,具有 20 萬到 100 萬的上下文窗口。Opus 可用於任務自動化、研發、策略制定等。這是 Claude 3 中最智能的 AI 模型,也超越了其競爭對手 GPT4、Gemini 等。

Claude 3 Opus 的成本為 $15(每百萬輸入字元)和 $75(每百萬輸出字元)。


Sonnet

Sonnet 是僅次於 Opus 的次高智能模型,並且比 Opus 更具成本效益。它在智慧與速度之間達到理想平衡,專注於企業工作負載,適用於數據處理、銷售、行銷、編程及其他日常工作。其上下文窗口為 20 萬,可達到 100 萬。

Claude 3 Sonnet 的成本為 $3/百萬輸入字元與 $15/百萬輸出字元,比 Opus 便宜 5 倍。


Haiku

Haiku 是最快且最便宜的 AI 模型,能夠近乎即時地回應。由於其反應迅速且成本低廉,適合用於客戶支援和即時聊天。Haiku 的上下文窗口同樣為 20 萬至 100 萬。


Claude 3 Haiku 的成本為 $0.25/百萬輸入字元與 $1.25/百萬輸出字元,比 Opus 模型便宜 60 倍,且比 Sonnet 模型便宜 12 倍。


Claude 3 基準測試

Anthropic 發布了一份研究報告,涵蓋了 Claude 3 家族的基準測試數據,包括推理、閱讀理解、數學、科學和編程能力。結果顯示,Claude 3 不僅超越了其前代模型,還在許多情況下實現了無與倫比的成果。基準測試對象包括 Claude 3 的 Opus、Sonnet、Haiku 模型,及 GPT-4、GPT3.5、Gemini 1.0 Ultra、Gemini 1.5 Pro 和 Gemini 1.0 Pro。


Claude 3 Benchmarks

資料來源:Anthropic


Claude 3 的視覺處理能力與其競爭對手不相上下。模型能處理包括照片、圖表、圖形及技術圖解在內的多種視覺格式。以下是 Claude 3 的視覺處理能力基準測試數據。


Claude 3 Benchmark

Source: Anthropic


Claude 3 在面對無害提示時的拒絕率也比其前代模型 Claude 2.1 更低,證明其在理解提示的能力上有所提升,而非單純依賴關鍵詞過濾。以下是 Anthropic 提供的圖表。


Claude 3 Incorrect refusals

Source: Anthropic


Claude 3 在準確性上也較 Claude 2.1 有明顯改善。AI 聊天機器人常常會給出錯誤答案,或生成毫無意義的文字或代碼。而 Claude 3 的這一現象顯著減少,與 Claude 2.1 相比準確性大幅提高。


Claude 3 Hard questions

Source: Anthropic


Claude 3 的長上下文理解能力和強大的記憶能力,讓其能有效地從龐大的數據集中查找並檢索正確信息。其性能在 “Needle in a Haystack” (NIAH) 基準測試中得到了評估,該測試衡量模型是否能準確回答問題,並在大型數據集中定位相關細節。Claude 3 Opus 在此基準測試中實現了接近完美的記憶能力與 99% 的準確率。


Claude 3 Opus recall accuracy

Source: Anthropic


Claude 3 與 Claude Chat

Claude 3 可通過 Claude Chat 使用,其中包含 Claude 3 Sonnet 和 Claude 3 Opus,提供類似 ChatGPT 的介面。然而,Claude 3 Opus 模型需要支付 $20/月的訂閱費。您可以在 https://claude.ai/chat/ 註冊以獲取使用權限。


Using claude 3 with claude chat

Claude 3 與 Workbench

您可以通過註冊 https://console.anthropic.com/ 免費使用所有三款 Claude 3 模型,在此處可檢查 API 並獲取 API 密鑰。Anthropic 為用戶提供 $5.00 的啟動禮金。


Claude 3 with Workbench

Claude 3 與 Amazon Bedrock

AWS 也宣布在 Amazon Bedrock 上推出 Claude 3 Haiku 和 Sonnet 模型。您可以通過 Amazon Bedrock 或使用 AWS 訪問密鑰從 Bedrock 客戶端訪問。


Claude 3 with Amazon Bedrock

以下示範了使用 AWS 訪問密鑰和 Bedrock 客戶端進行的 Claude 3 Haiku 模型運行過程。


Claude 3 Amazon Bedrock

結論

從基準測試數據與實際應用情況來看,Claude 3 無疑在大多數使用案例中成為佼佼者。但這場 AI 大戰才剛剛開始,目前還很難下結論。Anthropic 表示 Claude 3 還遠未達到極限,並計劃在未來幾個月內對 Claude 3 家族進行更頻繁的更新。我們拭目以待

bottom of page