50033 蘋(píng)果GPT披上谷歌的外衣?
服務(wù)熱線:400-858-9000 咨詢/投訴熱線:18658148790
國(guó)內(nèi)專(zhuān)業(yè)的一站式創(chuàng)業(yè)服務(wù)平臺(tái)
蘋(píng)果GPT披上谷歌的外衣?
03/20
如果Gemini最終真出現(xiàn)在了今年9月即將發(fā)布的iPhone 16上,那就意味著,MacBook好不容易擺脫了英特爾的噩夢(mèng),iPhone卻又著了谷歌的道。
本文來(lái)自于微信公眾號(hào)“鋅產(chǎn)業(yè)”(ID:xinchanye2021),作者:山竹,投融界經(jīng)授權(quán)發(fā)布。

我是在出差途中看到關(guān)于蘋(píng)果MM1消息的,當(dāng)時(shí)并沒(méi)有覺(jué)得驚訝,畢竟蘋(píng)果放棄造車(chē)、轉(zhuǎn)戰(zhàn)生成式AI的消息早已不是秘密。

讓我感到驚訝的是,最懂蘋(píng)果的彭博社記者M(jìn)ark Gurman爆料稱(chēng),蘋(píng)果正在和谷歌洽談“將Gemini植入iPhone事宜”。

如果Gemini最終真出現(xiàn)在了今年9月即將發(fā)布的iPhone 16上,那就意味著,MacBook好不容易擺脫了英特爾的噩夢(mèng),iPhone卻又著了谷歌的道。

即便只是暫時(shí)聯(lián)姻,但Android陣營(yíng)的大模型滲透到蘋(píng)果系統(tǒng)中,這也堪稱(chēng)是前無(wú)古人了。

話雖如此,但我們還是有必要了解一下蘋(píng)果對(duì)于生成式AI的態(tài)度轉(zhuǎn)變,以及關(guān)于下一代AI iPhone的猜想。

01

MM1的戰(zhàn)略意圖

就在上周,蘋(píng)果團(tuán)隊(duì)產(chǎn)出了一篇關(guān)于多模態(tài)預(yù)訓(xùn)練大模型的論文,蘋(píng)果名為MM1的多模態(tài)預(yù)訓(xùn)練大模型在這篇論文中也浮出水面。

MM1,大多數(shù)果粉聽(tīng)起來(lái)都會(huì)覺(jué)得這名字耳熟得很。

無(wú)論蘋(píng)果是有意還是無(wú)意,這名字確實(shí)容易讓人想起蘋(píng)果MacBook搭載的第一代基于ARM架構(gòu)自研的處理器M1,也是憑借M1,蘋(píng)果最終擺脫了英特爾多年的噩夢(mèng),真正實(shí)現(xiàn)了絕對(duì)的軟硬一體。

蘋(píng)果將自己的大模型命名為MM1,似乎也有想要擺脫現(xiàn)在市面上幾乎一手遮天的OpenAI影響的寓意。

每篇研究論文,關(guān)鍵之處在于獨(dú)創(chuàng)性,這也就是所謂的研究成果。

蘋(píng)果公司這篇名為MM1的論文,雖然沒(méi)有透露出太多公司戰(zhàn)略層面的想法,但是也輸出了一些蘋(píng)果AI研究團(tuán)隊(duì)的認(rèn)知:

例如,蘋(píng)果AI研究團(tuán)隊(duì)在論文中指出,對(duì)于多模態(tài)預(yù)訓(xùn)練大模型而言,使用圖像字幕、圖像文本交錯(cuò)內(nèi)容、純文本內(nèi)容的組合對(duì)于在多個(gè)基準(zhǔn)測(cè)試中實(shí)現(xiàn)少量?jī)?yōu)秀測(cè)試結(jié)果至關(guān)重要。

蘋(píng)果AI研究團(tuán)隊(duì)在論文中還指出,在模型設(shè)計(jì)過(guò)程中,相關(guān)要素的重要性依次為:圖像分辨率(image resolution)、視覺(jué)編碼器的損耗和容量(visual encoder loss and capacity)、視覺(jué)編碼器預(yù)訓(xùn)練數(shù)據(jù)(visual encoder pre-training data)。

蘋(píng)果MM1大模型,則是基于LLM(大語(yǔ)言模型)+MoE(混合專(zhuān)家系統(tǒng))搭建而成的多模態(tài)大模型,參數(shù)規(guī)模有3B、7B、30B三個(gè)版本。

蘋(píng)果GPT披上谷歌的外衣?

實(shí)際上,MM1更像是蘋(píng)果在放棄造車(chē)后,一次不那么正式地對(duì)外官宣,官宣自己確實(shí)已經(jīng)在將大模型作為研發(fā)重心來(lái)對(duì)待。

早在2023年ChatGPT火遍全球時(shí),Mark Gurman就曾爆料,蘋(píng)果這年2月在喬布斯劇院舉辦了一場(chǎng)人工智能年度峰會(huì)。大模型和AI工具,正是這場(chǎng)僅允許蘋(píng)果內(nèi)部員工參與的活動(dòng)的主要議題。

隨后,《紐約時(shí)報(bào)》報(bào)道稱(chēng),盡管Siri存在設(shè)計(jì)缺陷已經(jīng)毋庸置疑,但蘋(píng)果工程師已經(jīng)在開(kāi)發(fā)類(lèi)似ChatGPT的人工智能。

不過(guò),這個(gè)五年前在蘋(píng)果內(nèi)部成立,由蘋(píng)果人工智能負(fù)責(zé)人John Giannandrea領(lǐng)導(dǎo)的16人團(tuán)隊(duì),彼時(shí)的研究方向還是對(duì)話式AI基礎(chǔ)模型。

直到去年,一個(gè)名為“Ajax”的大模型框架,以及一個(gè)被蘋(píng)果內(nèi)部員工稱(chēng)為“Apple GPT”的聊天機(jī)器人項(xiàng)目再次浮出水面,關(guān)于蘋(píng)果大模型的消息才有了些苗頭。

而這些無(wú)論是被稱(chēng)作對(duì)話式AI,還是大模型的項(xiàng)目,主要目標(biāo)就是改善Siri、搜索、地圖、Apple Music在內(nèi)的軟件體驗(yàn)。

這樣的商業(yè)導(dǎo)向,讓蘋(píng)果人工智能團(tuán)隊(duì)一直有著充足的預(yù)算,彭博社在2023年10月的一份報(bào)道中指出,蘋(píng)果每年在人工智能技術(shù)開(kāi)發(fā)上的預(yù)算高達(dá)10億美元。

只不過(guò),雖然Siri這兩年已經(jīng)正在變得好用,但由于蘋(píng)果的戰(zhàn)略搖擺,讓它沒(méi)能在百模大戰(zhàn)中嶄露頭角。

MM1的悄然上線,算是蘋(píng)果在放棄汽車(chē)、選定生成式AI這樣的業(yè)務(wù)調(diào)整后,一個(gè)戰(zhàn)略意圖上的顯露。

02

谷歌的GPT外衣

從蘋(píng)果AI研究團(tuán)隊(duì)這篇論文的測(cè)試報(bào)告中可以看到,和OpenAI、谷歌的多模態(tài)大模型相比,蘋(píng)果的MM1并不占優(yōu)勢(shì),甚至可以用差強(qiáng)人意來(lái)形容。

這就不難理解,為什么會(huì)傳出蘋(píng)果正在與谷歌談判,希望將Gemini應(yīng)用到iPhone中,Mark Gurman甚至爆料稱(chēng),蘋(píng)果也在與OpenAI進(jìn)行了接觸,在考慮使用OpenAI的大模型。

在手機(jī)上應(yīng)用谷歌的Gemini大模型,按理來(lái)說(shuō)也不足為奇,畢竟,谷歌Gemini Nano(18億/32.5億參數(shù)規(guī)模)本身就是專(zhuān)為手機(jī)這樣智能硬件設(shè)計(jì)的一款大模型。

更何況,這一模型不僅用在了谷歌自己的Pixel 8 Pro上,還被三星用到了今年年初發(fā)布的旗艦手機(jī)Galaxy S24上。

蘋(píng)果GPT披上谷歌的外衣?

所以,嚴(yán)格意義上來(lái)說(shuō),這是一個(gè)在主流手機(jī)上已經(jīng)經(jīng)過(guò)驗(yàn)證的端側(cè)大模型,保真保熟。

只不過(guò),如果將三星換成蘋(píng)果,這件事兒的意義就不一樣了。

眾所周知,蘋(píng)果是自成一體的封閉系統(tǒng),而且還是一套和谷歌陣營(yíng)的Android一向?qū)α⒌牡诙笫謾C(jī)生態(tài)體系,如果選擇聯(lián)姻,意味著蘋(píng)果手機(jī)在軟硬一體上的優(yōu)勢(shì)將在一定程度將被打破。

畢竟大模型和其它軟件不太一樣,雖然現(xiàn)在在手機(jī)上還看不出有什么石破驚天的創(chuàng)新應(yīng)用,但在未來(lái)將會(huì)是一個(gè)不亞于芯片的根技術(shù)。

實(shí)際上,從Mark Gurman的爆料來(lái)看,蘋(píng)果這次與谷歌談合作,也是打算在本地用自己的大模型,在云端用谷歌的Gemini提供文本生成和圖像生成等功能。

這樣看來(lái),蘋(píng)果的這一舉措更像是一個(gè)”緩兵之計(jì)“。

既然打不過(guò),那就先拿來(lái)用吧。

庫(kù)克畢竟不是喬布斯,沒(méi)有技術(shù)潔癖,這樣的技術(shù)組合,商業(yè)上依然是成功的,對(duì)于當(dāng)下的iPhone來(lái)說(shuō)也未嘗不可。

只不過(guò),蘋(píng)果以往在人工智能技術(shù)上的高投入,似乎就打了水漂。

郭明錤在2023年10月就曾預(yù)測(cè),蘋(píng)果每年至少需要投資數(shù)十億美元,才有可能在生成式AI上追上競(jìng)爭(zhēng)對(duì)手。

這樣算來(lái),蘋(píng)果一年10億美元的AI投入,還是顯得少了些。

而關(guān)于蘋(píng)果在生成式AI到底有哪些關(guān)鍵成果,在今年2月的蘋(píng)果一季度電話會(huì)議上,庫(kù)克透露,“我們很高興將在今年晚些時(shí)候分享我們正在進(jìn)行的人工智能工作的相關(guān)細(xì)節(jié)?!?/span>

這一時(shí)間節(jié)點(diǎn)很可能是今年6月的WWDC 2024,搭載蘋(píng)果生成式AI的產(chǎn)品則很可能是iOS 18,以及今年秋季即將發(fā)布的iPhone 16。

03

關(guān)于AI iPhone的猜想

就在昨天,高通高調(diào)對(duì)外發(fā)布了一顆新處理器——驍龍8s Gen 3。

芯片廠商的產(chǎn)品向來(lái)版本眾多,新名字聽(tīng)得大家也是云里霧里,而這顆芯片,其實(shí)是驍龍8 Gen 3的低配版(官方稱(chēng)之為性能版)。

即便如此,這仍是一顆最高支持100億參數(shù)大模型的手機(jī)處理器。

低配版的處理器都已經(jīng)開(kāi)始支持百億參數(shù)大模型,由此可見(jiàn),大模型已經(jīng)成了智能手機(jī)的標(biāo)配。

就在智能手機(jī)都開(kāi)始標(biāo)配大模型、換殼“AI手機(jī)”時(shí),如何使用大模型就成了那個(gè)最關(guān)鍵的問(wèn)題。

現(xiàn)在來(lái)看,就新一代蘋(píng)果手機(jī)或iOS系統(tǒng)而言,我們能夠期待的是:

1、語(yǔ)音助手Siri能夠通過(guò)生成式AI變得聰明些;

2、百年不變的攝像/攝影功能通過(guò)生成式AI搞一些新玩法;

3、攝影功能在生成式AI的加持下可以和Vision Pro進(jìn)一步聯(lián)動(dòng),讓為Vision Pro創(chuàng)造3D內(nèi)容變得更簡(jiǎn)單;

4、在Pages、Keynote等辦公軟件上加入自動(dòng)摘要、文生圖等內(nèi)容生成功能,那種能夠更容易上手和使用的內(nèi)容生成功能;

5、最好能再通過(guò)生成式AI創(chuàng)造出兩個(gè)我們都不曾想到的新鮮玩法。

當(dāng)然,鋅產(chǎn)業(yè)認(rèn)為,毫無(wú)懸念的是,這次通過(guò)生成式AI,蘋(píng)果Siri必然會(huì)迎來(lái)一次空前升級(jí)。

憑借超10億優(yōu)質(zhì)iPhone活躍用戶,這次,借助生成式AI,蘋(píng)果或許能夠重啟語(yǔ)音交互時(shí)代。

蘋(píng)果 MM1 谷歌
評(píng)論
還可輸入300個(gè)字
專(zhuān)欄介紹
鋅產(chǎn)業(yè)
20篇文章
用技術(shù)范式,給未來(lái)一個(gè)解釋。
+關(guān)注
400-858-9000
免費(fèi)服務(wù)熱線
kefu@trjcn.com
郵箱
09:00--20:00
服務(wù)時(shí)間
18658148790
投訴電話
投融界App下載
官方微信公眾號(hào)
官方微信小程序
Copyright ? 2024 浙江投融界科技有限公司(770374.com) 版權(quán)所有 | ICP經(jīng)營(yíng)許可證:浙B2-20190547 | 浙ICP備10204252號(hào)-1 | 浙公網(wǎng)安備33010602000759號(hào)
地址:浙江省杭州市西湖區(qū)留下街道西溪路740號(hào)7號(hào)樓301室
浙江投融界科技有限公司trjcn.com版權(quán)所有 | 用戶協(xié)議 | 隱私條款 | 用戶權(quán)限
應(yīng)用版本:V2.7.8 | 更新日期:2022-01-21
 安全聯(lián)盟
在線客服
手機(jī)APP
微信訂閱