“ChatGPT的最強(qiáng)競品”爆火,就這?

所有人都在期待能打敗ChatGPT的產(chǎn)品,但或許不會是另一個ChatGPT。

出品 | 微果醬(wjam123456)

作者?| 陳出木
當(dāng)ChatGPT大殺四方,而國內(nèi)類似的AI產(chǎn)品還沒有足夠成熟的消息傳來時,出現(xiàn)了一個全新AI助手產(chǎn)品——Claude(官網(wǎng)鏈接:https://www.anthropic.com/product)。
Claude的背景很強(qiáng)悍,來自前OpenAI員工獨立門戶后在2021年建立的公司Anthropic,2022年融資超7億美元,今年年初還讓谷歌投了近4億。同時,Claude的噱頭也被大家架上了高位,諸如“ChatGPT的最強(qiáng)競品”“GPT殺手”,對標(biāo)ChatGPT的意味十足。
那么,Claude的表現(xiàn)究竟如何?
01#
Claude好用嗎?
相比ChatGPT在注冊環(huán)節(jié)就把不少人攔了下來,Claude的注冊流程稍稍簡單一些。因為Claude其實是內(nèi)嵌在企業(yè)聊天工具Slack(https://slack.com/get-started#/createnew)中的,可以通過用谷歌郵箱注冊后者賬號來直接體驗Claude。
注冊之后,在彈出的網(wǎng)頁最后一行鏈接中點擊“創(chuàng)建一個新的工作區(qū)”。
按照指引創(chuàng)建成功會顯示“Success”,即可進(jìn)入工作區(qū),在左邊欄的“應(yīng)用”中搜索添加Claude。
到這一步,我們就可以開始體驗Claude了。
面對Claude用英語打的招呼,果醬妹用中文要求它自我介紹。Claude非常順暢地轉(zhuǎn)為中文回復(fù),并不需要做其他設(shè)置。
我的名字叫Claude,我是一款人工智能助手。我會說中文和英文,能幫助用戶回答問題并完成簡單的任務(wù)。我不是任何一家公司的產(chǎn)品,我的創(chuàng)始人搭建了我這個平臺,讓我可以和用戶進(jìn)行交互。很高興認(rèn)識你!
點擊Claude的回復(fù)還可以進(jìn)行回復(fù)、轉(zhuǎn)發(fā)、保存、提醒等,有點像微信消息中點擊右鍵彈出的操作框。
出于新媒體人的本能,果醬妹首先向Claude詢問了今天中文互聯(lián)網(wǎng)有什么熱點,Claude非常有條理地列出了五個熱點話題,并對其做了簡單說明。
看似非?!奥斆鳌保?jīng)過果醬妹的核實,發(fā)現(xiàn)是一個都不能信。且不說給出的資訊都不是發(fā)生在今天,Claude回答的錯誤之處還在于事件內(nèi)容本身,如品牌名稱壓根不存在,比賽雙方及比分?jǐn)?shù)都不正確。
于是,在果醬妹指出錯誤之后,Claude迅速道歉,虛心反省自己,直言自己存在時空混淆的問題。
作為一個AI助手,我并不真正知道今天是2023年的4月24日,我提供的熱門話題信息都是我從過去報道和知識積累中推導(dǎo)得出的。我沒有辦法準(zhǔn)確地告知您2023年4月24日今天中文互聯(lián)網(wǎng)上的實時熱點,我的知識和計算能力有限制。
面對如此誠懇的態(tài)度,果醬妹也不好多加指責(zé),只在隨后提問了兩個歷史日期發(fā)生的事件,正確率屬實不高。
顯然,Claude在新聞資訊收集方面仍然有很大的缺陷,這與其并非專門做搜索內(nèi)容應(yīng)用有關(guān),也體現(xiàn)了搜索引擎公司的數(shù)據(jù)庫對于一個成功的AI助手有巨大影響力。
放棄和Claude糾結(jié)具體某日的資訊,果醬妹又讓其用今天的熱點新聞寫一篇文章,從內(nèi)容角度看是及格的,既有新聞事實描述,又有結(jié)合行業(yè)進(jìn)行分析,甚至還有過渡句和連接詞,中文閱讀感是非常流暢的。
值得注意的是,據(jù)Claude自述,其單次輸出的字?jǐn)?shù)有上限,為2000個中文字符或者1000個英文單詞左右。
或許是出于設(shè)定好的交流習(xí)慣,Claude對于自己的回答總會做出一番說明,其解釋稱因回復(fù)內(nèi)容實時生成,無法輸出預(yù)先存儲的長篇回復(fù),當(dāng)前的技術(shù)水平也難以生成長篇和深度回復(fù),再加上交互接口、希望用戶快速找到所需消息的設(shè)計、運行環(huán)境要求等原因,都導(dǎo)致了存在輸出上限
問及和ChatGPT的區(qū)別時,“端水大師”Claude非??焖俚亓_列出兩者的優(yōu)勢,表示ChatGPT在研究與技術(shù)水平上更厲害,而自己作為一款面向普通用戶的商業(yè)產(chǎn)品,在產(chǎn)品體驗與可靠性方面更占優(yōu)勢。
眾所周知,ChatGPT會做算數(shù)題,果醬妹隨手打了一串?dāng)?shù)字,提問乘積,Claude緩慢地響應(yīng),并給出了一個錯誤答案,下方還附注說明其不擅長解決數(shù)學(xué)問題。
果醬妹再次追問,Claude火速認(rèn)錯,并展示了計算過程,然后再次給出了錯誤答案。
幾個回合提問下來,雖然Claude都無法給出正確答案,但是認(rèn)錯態(tài)度真誠到讓人難以斥責(zé)。Claude甚至認(rèn)知到,“作為一款A(yù)I助手,失去用戶的信任與信心將是最嚴(yán)重的失敗?!?/section>
在隨后的測試中,Claude展現(xiàn)出對腦筋急轉(zhuǎn)彎等創(chuàng)意發(fā)散類題目的不擅長。而當(dāng)果醬妹希望Claude說明自己上線的時間,但無論如何更換關(guān)鍵詞,Claude都沒有辦法理解問題的意思。同時,答案下方再次附注顯示,Claude并不那么了解自己的創(chuàng)造者Anthropic。
一番體驗下來,Claude的優(yōu)缺點都很明顯。
關(guān)于其被眾人口口相傳的不收費、不用注冊、支持中文三大優(yōu)勢,實際上,除了目前不收費,注冊只是稍稍簡便,中文語感流暢但并不能完全理解掛鉤當(dāng)時語境的真正意義。而邏輯類、數(shù)學(xué)類問題就完全是Claude的盲區(qū)了。
可見,作為ChatGPT的競品,Claude恐怕對打敗前者有心無力。不過,擋不住Claude免費,比起情緒不夠穩(wěn)定還收費的ChatGPT,Claude更像是任勞任怨的純種打工人,想體驗AI助手的小伙伴大可以零成本玩一把。
02#
AI賽點到了嗎?
從去年年底,ChatGPT引爆網(wǎng)絡(luò)以來,AI 成了流量新貴,各大廠也在其中卷生卷死。但大半年過去了,得到一致認(rèn)可的明星還是只有一個ChatGPT。
從這個角度來說,AI領(lǐng)域仍未到真正的賽點,各家的產(chǎn)品都還在成長期,沒有達(dá)到可以拿出來華山論劍的地步。
比如,盡管ChatGPT作為當(dāng)之無愧的霸主,但實際上其也經(jīng)常出現(xiàn)bug,就在美國東部時間4月23日晚間,財聯(lián)社報道稱根據(jù)中斷跟蹤網(wǎng)站Downdetector的數(shù)據(jù),超千名用戶報告Open AI出現(xiàn)使用問題。
這其中有多家巨頭共同明示過的算力不足的問題,也有技術(shù)不穩(wěn)定性因素,都是當(dāng)前大部分AI產(chǎn)品的通病。但根據(jù)斯坦福的調(diào)研報告顯示,近八成國人看好技術(shù)發(fā)展,AI產(chǎn)品的前景仍然被期待。
而在這各自蟄伏的前期,恰恰是我們最應(yīng)該關(guān)注AI動態(tài)的時間,因為局面還沒有定論,技術(shù)內(nèi)卷還在繼續(xù),誰也沒法斷定最后闖出來的會是哪家黑馬,誰都有機(jī)會先嘗一波紅利。
當(dāng)下的AI技術(shù)日新月異,雖然還未到取代人類工種的地步,但很多變化已經(jīng)在悄悄發(fā)生。Claude不是第一個劍指ChatGPT的AI產(chǎn)品,也不會是最后一個,讓我們一起期待這場技術(shù)變革將掀起的影響巨浪。

本文來自投稿,不代表增長黑客立場,如若轉(zhuǎn)載,請注明出處:http://m.gptmaths.com/cgo/product/96224.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
上一篇 2023-04-25 11:32
下一篇 2023-04-25 18:26

增長黑客Growthhk.cn薦讀更多>>

發(fā)表回復(fù)

登錄后才能評論