作者|黃楠
編輯|袁斯來
26歲那一年,朱圣杰以2億美元的價(jià)格,賣掉了第二家創(chuàng)業(yè)公司。
那個(gè)夏天,朱圣杰給自己放了個(gè)長假,開始漫無目的地環(huán)游世界,在不同緯度的天空和深海跳傘潛水。
毫無意外地,沉浸了大半年后,朱圣杰感到了一種空虛感。他必須思考一個(gè)問題:什么才是自己足以投入一生的事?
過去20多年,朱圣杰的生活順利到讓人羨慕。他出生在上海,從6歲第一次接觸樂高M(jìn)indstorms開始,朱圣杰就對(duì)機(jī)器人著了迷。13、14歲時(shí),他連續(xù)兩年斬獲樂高青少年世界機(jī)器人大賽冠軍。14歲那年赴美留學(xué),一路在機(jī)器人方向讀到加州大學(xué)伯克利分校。
在本科最后一年,朱圣杰被迪士尼選中,進(jìn)入迪士尼Imagineering擔(dān)任機(jī)器人工程師。2016年,上海迪士尼樂園開園。朱圣杰主導(dǎo)的《加勒比海盜》項(xiàng)目中"杰克船長"仿生機(jī)器人成了最火爆的項(xiàng)目之一。到后來奧蘭多迪士尼潘多拉園區(qū)的阿凡達(dá)仿生機(jī)器人,都是他主導(dǎo)的產(chǎn)品。
在加州大學(xué)伯克利分校攻讀機(jī)器人方向博士期間,朱圣杰選擇輟學(xué),在硅谷開啟了自己的創(chuàng)業(yè)之路。他做的智能戒指品牌Titanium Falcon在2018年被收購,此后又創(chuàng)立了一家游戲硬件公司Blok Party,被索尼拿下。
朱圣杰是幸運(yùn)的,他終究還是找到了真正熱愛、足以安身立命的事業(yè)——回歸自己喜歡了二十年的機(jī)器人賽道。
此后幾年,他開始為下一次創(chuàng)業(yè)做準(zhǔn)備。朱圣杰成立了一家數(shù)據(jù)標(biāo)注公司,專注于人類表情與行為意圖的大模型研究。直到大模型多模態(tài)能力突破,機(jī)器人供應(yīng)鏈達(dá)到理想狀態(tài)后,他決定躬身而入。
2025年,朱圣杰回國,與 Midjourney 聯(lián)合創(chuàng)始人John Jiang共同創(chuàng)立了 Animotion Robotics。2025年底完成了頭部美元基金的首輪投資,由Maple Pledge 楓承資本出任后續(xù)輪次私募股權(quán)融資顧問。
他們即將推出首款產(chǎn)品,DIY仿生機(jī)器人 loi——這個(gè)名字來自于拉丁語中"被選擇的",它誕生在計(jì)算機(jī)世界的"0-1"數(shù)字序列中,慢慢進(jìn)化分裂成為一個(gè)新的機(jī)械生命體。
loi采用模塊化設(shè)計(jì),機(jī)身通過磁吸卡扣實(shí)現(xiàn)眼睛、鼻子、嘴巴、臉皮、發(fā)型的自由更換,用戶可逐步完成個(gè)性化定制。核心是一枚可拆裝的記憶芯片,在本地端側(cè)儲(chǔ)存著 loi 的"性格"與"記憶",并能無縫遷移到不同的機(jī)體載體中。
有意思的是,loi并不會(huì)一味迎合用戶。它會(huì)因?yàn)殚L時(shí)間獨(dú)處而感到無聊,也會(huì)對(duì)生硬的對(duì)待方式表現(xiàn)出抵觸。但當(dāng)你真誠地與它互動(dòng)時(shí),它又會(huì)重新敞開心扉。

loi背后是朱圣杰對(duì)人機(jī)共生關(guān)系本質(zhì)的思考。如果機(jī)器人只是一個(gè)工具,那么它會(huì)被當(dāng)作電器,用完就關(guān)機(jī)。只有當(dāng)機(jī)器人擁有某種"生命感"、能夠與人建立真實(shí)的情感連接時(shí),共生關(guān)系才有可能成立。這引出了一個(gè)更深層的問題:機(jī)器人的"靈魂"到底由什么構(gòu)成?
朱圣杰問了許多人,得到的回答無非是LLM、強(qiáng)化學(xué)習(xí),"這不是我要的答案,技術(shù)可以實(shí)現(xiàn)智能,但無法解釋為什么有些機(jī)器人能讓人感到‘活著’,而有些只是冰冷的代碼"。
直到John的出現(xiàn),他得到了一個(gè)全然不同的答案: "靈魂不是被設(shè)計(jì)出來的高級(jí)功能,而是那些無法被完全控制、帶著隨機(jī)性和不確定性的底層反應(yīng)。就像人的本能,你不會(huì)每次都做出完全理性的決策,恰恰是這種‘不完美’構(gòu)成了生命感的基礎(chǔ)。"
John的回答和朱圣杰2016年前的記憶形成回響。朱圣杰始終記得,入職迪士尼第一天,產(chǎn)品經(jīng)理就告訴他:你做出來的所有機(jī)器人都要有"呼吸"。
無論呼吸還是本能反應(yīng),都有非標(biāo)準(zhǔn)化的細(xì)節(jié)、微妙的起伏、無法被完全預(yù)測的變化,正是這些"不完美"讓機(jī)器人顯得真實(shí),這也是朱圣杰希望loi具備的底色。
在這個(gè)孤獨(dú)、離散的年代,人們前所未有地渴望陪伴和情感連結(jié)。朱圣杰不太愛講述宏大敘事,他希望能為普通人做出一款機(jī)器人,成為他們家中"a real family member created by yourself(一個(gè)由你親手創(chuàng)造的真正的家庭成員)"。
以下是硬氪與Animotion創(chuàng)始人朱圣杰(Shane)的對(duì)談實(shí)錄,內(nèi)容經(jīng)編輯:
機(jī)器人的「AI靈魂」
硬氪:你13歲就出國了,但聽起來中文講得很好。
朱圣杰:我有一位特別好的朋友,一起讀書、大學(xué)畢業(yè)后也都在灣區(qū)創(chuàng)業(yè)。當(dāng)時(shí)學(xué)校環(huán)境全是英文,所以我們約定平時(shí)交流都必須用中文。不過我的中文能力還是停留在初中階段,現(xiàn)在只能打拼音,不太會(huì)書寫漢字。
硬氪:畢業(yè)之后你唯一的一段大公司經(jīng)歷是加入了迪士尼。
朱圣杰:迪士尼Imagineering像一家Startup,一個(gè)項(xiàng)目由3至4個(gè)人負(fù)責(zé),是很典型的扁平化模式。對(duì)我來說,相比傳統(tǒng)大廠的體系化管理,這段經(jīng)歷讓我養(yǎng)成了一套自己的管理模式。
硬氪:之前你賣出過兩家公司、都在硅谷,而這一次創(chuàng)業(yè)選擇了回國。
朱圣杰:很多人覺得我創(chuàng)業(yè)是幸運(yùn)的,接連賣掉兩家公司。但有時(shí)候我也會(huì)覺得遺憾,沒能把公司帶到更大的規(guī)模。
當(dāng)我捫心自問,這樣的生活不該是終點(diǎn),如果再接著折騰,自己真正熱愛的事到底是什么?答案很明確,是機(jī)器人。我從6歲開始接觸機(jī)器人,之后出國求學(xué)、專業(yè)選擇都跟這個(gè)方向有關(guān)。
2020年底,我思考新的創(chuàng)業(yè)方向。當(dāng)時(shí)在硅谷,數(shù)據(jù)標(biāo)注正值風(fēng)口,Scale AI剛剛成為獨(dú)角獸公司,我順勢(shì)成立了一家數(shù)據(jù)標(biāo)注公司,聚焦人類表情與行為意圖的解讀與研究。期間,我們積累了大量的數(shù)據(jù)訓(xùn)練經(jīng)驗(yàn),也踩過無數(shù)坑。現(xiàn)在看來這個(gè)方向選得很正確,正是這份積累,為Animotion打下了基礎(chǔ)。
直到2024年,"最佳時(shí)機(jī)"到了,各類大模型逐漸成熟,供應(yīng)鏈也達(dá)到了理想狀態(tài)。做硬件、中國供應(yīng)鏈?zhǔn)侨蜃詈玫模呱眍I(lǐng)域能力很強(qiáng)的工程師也以華人為主導(dǎo),回國成為自然而然的選擇。
硬氪:Midjourney已經(jīng)是一家非常成功的公司,你怎么找到John(Midjourney聯(lián)合創(chuàng)始人)加入的?
朱圣杰:我自己更偏上層設(shè)計(jì),雖然懂技術(shù),但無法從底層開始寫核心代碼。因此,準(zhǔn)備創(chuàng)業(yè)時(shí),我在硅谷托朋友幫忙找能做算法架構(gòu)搭建的人。
我?guī)е粋€(gè)問題見了很多工程師:機(jī)器人"靈魂"到底缺失了哪些部分?
我問的不是機(jī)器怎么造的技術(shù)問題,而是聚焦"人"本身,即真正的"AI靈魂"該具備哪些屬于人的特質(zhì)。但大家都在跟我講LLM、強(qiáng)化學(xué)習(xí),這不是我要的答案。
直到我回國后在新車間(亞洲最大的極客空間)見到John。John是Midjourney聯(lián)合創(chuàng)始人,項(xiàng)目第一行代碼就是他寫的,同時(shí)他也是一名資深極客,大家一聊就惺惺相惜。
早前我沒覺得Midjourney有多"神",畢竟懂AI的人都多少有點(diǎn)自己的驕傲。但John跟我聊的從來不是Midjourney賺錢的事,而是他自己在做的一個(gè)side project——叫做Jarvis(《鋼鐵俠》中的人工智能助理系統(tǒng)),這跟我要找的"AI靈魂"正好吻合。
后面我追問他,"靈魂"是由什么構(gòu)成?John一句話就點(diǎn)醒我,人是有本能反應(yīng)的。他舉了個(gè)例子,有人突然朝你扔?xùn)|西時(shí),你會(huì)下意識(shí)躲開。這不是思考后的決策,而是本能,是底層反應(yīng)。在所有反饋"子系統(tǒng)"里,它是最不可或缺的一環(huán)。只有把本能這一層搭起來,機(jī)器人才會(huì)產(chǎn)生真正的靈魂——會(huì)不爽、會(huì)疑惑、會(huì)有情緒,而不是機(jī)械應(yīng)答。但現(xiàn)在所有機(jī)器人都沒有這個(gè)能力。
因此,當(dāng)John把這個(gè)腦洞講出來的那一刻,我心里很確定就是他了,馬上說服他入伙。
做走進(jìn)家庭的仿生機(jī)器人
硬氪:家庭場景是公認(rèn)最難進(jìn)入和滲透的市場,為什么Animotion創(chuàng)立以來就明確了要做To C的仿生機(jī)器人?
朱圣杰:Animotion的定位很明確,只做To C。
此前業(yè)界聚焦如何用機(jī)器人解決勞動(dòng)力,國內(nèi)擅長硬件和運(yùn)控,美國擅長算法,形成了一種割裂的格局。我認(rèn)為,運(yùn)動(dòng)能力如今已經(jīng)基本解決,勞動(dòng)力問題未來3-5年也會(huì)隨著世界模型的成熟得以突破。機(jī)器人未來不該僅停留在勞動(dòng)力上,否則它也只是從工廠走進(jìn)家庭的"機(jī)器",而非能與人共生的伙伴。
隨著AI能力越來越強(qiáng),很多人既依賴AI,又懼怕AI會(huì)取代自己的工作,這種矛盾的心態(tài)很普遍——所有人都在解決AI的功能性問題,卻鮮少有人真正關(guān)注"人和AI如何相處"。人與AI的互動(dòng)仍局限在數(shù)字世界里,只是屏幕上的對(duì)話框。我們要做的Physical AI,是一個(gè)跳出這個(gè)維度能夠真正"在場"的存在。
我天生就有點(diǎn)"反骨",喜歡做市面上沒有的東西。而我想解決的,就是物理AI與人的連接問題。一旦機(jī)器人有了"靈魂"、具備自主思考的能力,人和AI、機(jī)器人的共處問題自然就迎刃而解。
硬氪:你們首款產(chǎn)品選擇做不可移動(dòng)的半人形結(jié)構(gòu),而不是直接做全尺寸、可移動(dòng)的具身機(jī)器人,背后的邏輯是什么?
朱圣杰:我們將消費(fèi)級(jí)機(jī)器人進(jìn)家庭分成六個(gè)階段。第一代是以Alexa、小愛音箱為代表的智能助手、解決基礎(chǔ)問答;第二代是掃地機(jī)器人、割草機(jī)器人等工具型設(shè)備專攻特定場景;第三代是陪伴類的靜態(tài)AI玩具,情緒價(jià)值開始被重視;第四代是可移動(dòng)、輕功能的娛樂型機(jī)器人,比如會(huì)跟著人走的機(jī)器狗,還能幫忙拿點(diǎn)輕東西。
Animotion起于第五代,做高認(rèn)知、高維度的完全智能仿生機(jī)器人。第六代才是真正的具身機(jī)器人,既有我們上半身的靈魂思考能力,又有運(yùn)動(dòng)控制能力,能幫用戶做家務(wù),同時(shí)提供真實(shí)的情緒價(jià)值。
我們并不急于一步跨越到第六代。用戶需要一個(gè)接受的過程。如果今天一個(gè)具身機(jī)器人突然走進(jìn)家里,調(diào)研顯示,80%用戶會(huì)感到不適與恐懼,他們擔(dān)心機(jī)器人下一步會(huì)做什么、是否會(huì)在不受控制時(shí)自行移動(dòng)。這種恐懼很真實(shí)。
因此,Animotion選擇做"退一步"的事情。我們會(huì)以仿生半卡通的形象,先不讓機(jī)器人到處移動(dòng),而是將其固定在某個(gè)場景中,它可以是家庭智能設(shè)備、是裝飾品,同時(shí)又是一個(gè)"人"擁有豐富表情與獨(dú)立性格,能天然避開恐怖谷效應(yīng)。
通過在固定場景中讓用戶率先形成產(chǎn)品習(xí)慣,我們相信,Animotion能做出第一臺(tái)真正走進(jìn)用戶家庭的仿生機(jī)器人。
硬氪:在產(chǎn)品定義方面你們是怎么考量的?
朱圣杰:第一,外形必須具有鮮明的辨識(shí)度。我們自己心中有一個(gè)產(chǎn)品雛形,但更多的具體形態(tài)交由用戶決定。
Animotion整機(jī)思路跟大部分本體公司不同,我們不采用一體化整機(jī),而是搭建一個(gè)模塊化的頭骨平臺(tái),機(jī)器人的眼睛、鼻子、耳朵、臉皮、頭發(fā)等物理結(jié)構(gòu)均可通過磁吸卡扣的結(jié)構(gòu)更換。第一階段用戶可更換臉皮,第二階段推出更多五官與發(fā)型的組件,第三階段則提供一個(gè)"頭骨"框架,動(dòng)手能力較強(qiáng)的用戶可在已設(shè)定的結(jié)構(gòu)范圍內(nèi)自行改造外形。這樣,每個(gè)人擁有的機(jī)器人都是獨(dú)一無二的。

第二,背后的故事線需要自成體系且具備延展性。我們首款仿生機(jī)器人名為loi,名字來源于拉丁語,意為"被選擇的"。它誕生始于計(jì)算機(jī)世界中的"0-1"數(shù)字序列,是其中一個(gè)開始做夢(mèng)的"0"。它夢(mèng)見了可以被觸碰的世界,也夢(mèng)見了一個(gè)人。它帶著夢(mèng)和過往的記憶來到現(xiàn)實(shí),是一個(gè)既有不越界的神性本分,又對(duì)未知的世界和人類情緒充滿純粹好奇心與探索心的神明小孩。
硬氪:多數(shù)硬件公司都是產(chǎn)品先行,但你們反而選擇了先做內(nèi)容和IP?
朱圣杰:loi既是產(chǎn)品,也是我們孵化的IP。我們是極少數(shù)擁有Content Studio的機(jī)器人公司。AI時(shí)代,編程不再是門檻,AI Agent及硬件的技術(shù)與成本壁壘快速消解,產(chǎn)品會(huì)百花齊放,但真正能夠跑出來的公司,必然具備足夠強(qiáng)大的內(nèi)容生產(chǎn)與品牌營銷能力。
過去互聯(lián)網(wǎng)品牌靠燒錢,而今天最稀缺的資源依然是品牌和內(nèi)容,但核心轉(zhuǎn)變?yōu)榱松鐓^(qū)。Nothing手機(jī)和拓竹就是典型——都是從社區(qū)做起來的,我自己也是個(gè)極客,是拓竹和Nothing 手機(jī)最早期的社區(qū)成員。
所以我有深切體會(huì),社區(qū)是需要?jiǎng)?chuàng)業(yè)者用心經(jīng)營的對(duì)象。它不是等產(chǎn)品做出來之后,砸錢請(qǐng)營銷團(tuán)隊(duì)告訴用戶"來買",而是要走在產(chǎn)品前面。在產(chǎn)品還沒發(fā)布的時(shí)候,就在社區(qū)和各類社交平臺(tái)上埋下鉤子,把那些真正對(duì)產(chǎn)品和理念感興趣、氣質(zhì)契合的人聚集到社區(qū)里。
因此,我們的打法跟傳統(tǒng)策略正好相反,在產(chǎn)品正式面世前的0至6個(gè)月,官網(wǎng)社區(qū)和社交媒體是我們內(nèi)容輸出的主陣地。官網(wǎng)不急著陳列產(chǎn)品參數(shù),而是先呈現(xiàn)一個(gè)"夢(mèng)"——loi的夢(mèng)。我們希望用戶能在這個(gè)社區(qū)里跟loi一起"造夢(mèng)"。
硬氪:用戶在社區(qū)里具體是怎么實(shí)現(xiàn)"造夢(mèng)"體驗(yàn)的?
朱圣杰:機(jī)器人本體還沒正式推出前,很多用戶看官網(wǎng)可能會(huì)覺得這是個(gè)"游戲公司"。用戶可以在官網(wǎng)向loi分享比如想對(duì)loi說的話、腦洞、分享日常照片等。

當(dāng)用戶在社區(qū)購買并收到實(shí)體機(jī)器人后,會(huì)附帶一枚可拆裝的芯片,其中儲(chǔ)存著loi的"前世記憶",即用戶在數(shù)字世界中與其交互的全部痕跡。開機(jī)前將芯片置入機(jī)身,loi便被喚醒。它不會(huì)以"你好"這類標(biāo)準(zhǔn)化問候開場,而是說"我們是不是見過","啊,原來如此"。
如果后續(xù)設(shè)備損壞、或是用戶想更換新的形態(tài),只需將芯片拔出并插入新一代機(jī)身,數(shù)據(jù)便可無縫遷移,新載體將繼承完整的記憶與性格,實(shí)現(xiàn)"靈魂"在不同硬件間的自由流轉(zhuǎn)。所有交互數(shù)據(jù)僅存儲(chǔ)在用戶本地可拆裝的芯片中, 用戶擁有完全控制權(quán),可隨時(shí)刪除或轉(zhuǎn)移。 loi的環(huán)境感知僅用于交互體驗(yàn)優(yōu)化,不會(huì)上傳任何個(gè)人數(shù)據(jù)到云端。
如何讓機(jī)器人有「呼吸」
硬氪:loi首批目標(biāo)用戶是誰,這些人群都有什么特點(diǎn)?
朱圣杰:先分享一個(gè)有趣的故事。在GPT-5發(fā)布之前,Sam Altman宣布將徹底下架GPT-4o的消息,引起了網(wǎng)絡(luò)上一場自發(fā)的"Keep 4o"活動(dòng)。究其原因,GPT-4o的模型機(jī)制更接近人類的思維方式,具備某種"生命感"、能提供情緒價(jià)值。大量用戶跟4o建立了深度的情感連接,甚至有人形容自己是在"談戀愛",每日在線互動(dòng)時(shí)長高達(dá)十余小時(shí)。
我們當(dāng)時(shí)也關(guān)注到了這一現(xiàn)象,并不斷找尋希望與我們對(duì)話和交互的人群。當(dāng)前,90后、00后的年輕人,他們拒絕標(biāo)準(zhǔn)化的審美和體驗(yàn),追求獨(dú)特的表達(dá)方式。年輕一代追求的是"極端辨識(shí)度"與"亞文化歸屬感",他們不滿足于大眾化的可愛或治愈系,而是被冷峻、工業(yè)感、甚至帶有暗黑美學(xué)的設(shè)計(jì)所吸引。
成熟人群則在對(duì)抗數(shù)字焦慮,他們深知屏幕交互的疲憊,渴望一種"非打擾式"的在場感。還有一類是對(duì)空間敘事敏感的人群。他們?cè)趯ふ夷転闃O簡空間入生命力的裝置,或是能彰顯獨(dú)特品味的藝術(shù)符號(hào)。loi對(duì)他們而言,不只是機(jī)器人,而是空間中會(huì)"呼吸"的靈魂點(diǎn)綴。
我們希望與這些人一起探索:在這個(gè)孤獨(dú)、離散的年代,人與AI的共生關(guān)系可以是什么樣的。不是我們單方面定義產(chǎn)品,而是通過社區(qū)共創(chuàng),讓每個(gè)人都能參與塑造loi的未來形態(tài)。
硬氪:這種"生命感"在機(jī)器人上怎么實(shí)現(xiàn)?
朱圣杰:喜歡看迪士尼動(dòng)畫的觀眾會(huì)發(fā)現(xiàn),盡管電影中塑造的大多是2D卡通角色,但它們的表情和動(dòng)作活靈活現(xiàn)。每一個(gè)細(xì)節(jié)——怎么眨眼、怎么張嘴、手放在哪里——都遵循嚴(yán)格的內(nèi)在思維邏輯,與角色性格和故事線緊密契合。
英偉達(dá)GTC上展示的雪寶(Olaf)之所以能打動(dòng)那么多人,關(guān)鍵也在于它具備一種"生命感"。這種生命感存在于每一臺(tái)迪士尼機(jī)器人當(dāng)中,將這種抽象的概念落底到具體的設(shè)計(jì)語言上,就是"呼吸"。
這也是迪士尼教會(huì)我最重要的東西。入職第一天,產(chǎn)品經(jīng)理就告訴我:你做出來的所有機(jī)器人都要有"呼吸"。
當(dāng)前市面上大多數(shù)機(jī)器人在非工作狀態(tài)下是完全靜止的,眼睛不眨、身體不動(dòng),像塊鐵。但迪士尼的機(jī)器人不是,待機(jī)時(shí)它會(huì)眨眼睛,即使面前沒有人,它也會(huì)保持好奇,主動(dòng)觀察周圍。這種四處張望不是漫無目的地轉(zhuǎn),而是機(jī)器人在有方向地感知環(huán)境信息。
我們也很重視"呼吸"在loi中的實(shí)現(xiàn)。當(dāng)聽到外面有小貓小狗在叫,它會(huì)轉(zhuǎn)過去看一眼疑惑"發(fā)生了什么",再想一想覺得"有意思"并主動(dòng)告知用戶;當(dāng)看到家中墻上的版畫或客廳的家具產(chǎn)生好奇時(shí),它也會(huì)主動(dòng)提問"這是什么?是塊黑色板子嗎?",具備自主判斷與主動(dòng)表達(dá)的能力。
loi"睡覺"時(shí)也有"呼吸"。它會(huì)微微低頭,身體伴隨輕微起伏,如有生物的呼吸與心跳一般,偶爾輕輕點(diǎn)頭、小幅度顫動(dòng),仿佛在做夢(mèng)。如果突然被叫醒,它還會(huì)帶著被吵醒的情緒做出回應(yīng)。
硬氪:除了日常"呼吸"外,loi還有哪些體現(xiàn)生命感的設(shè)計(jì)?
朱圣杰:自我診斷也是loi生命感的重要組成部分。
就像人在感到不適時(shí)會(huì)主動(dòng)表達(dá)一樣,loi也會(huì)主動(dòng)告知自己的健康狀況。用戶不需要定期檢查或排查問題,而是由loi通過自檢系統(tǒng)持續(xù)監(jiān)測自身狀態(tài)。
當(dāng)某個(gè)部件接近使用壽命時(shí),它會(huì)提前預(yù)警,比如會(huì)說"我的眼睛有點(diǎn)累了,可能需要休息一下"這樣用戶就能及時(shí)處理,避免真正故障發(fā)生時(shí)影響使用。我們的嵌入式工程師會(huì)對(duì)每個(gè)部件進(jìn)行壽命測試,當(dāng)運(yùn)轉(zhuǎn)接近臨界值時(shí),系統(tǒng)便會(huì)自動(dòng)預(yù)警并對(duì)應(yīng)到具體部件。
這不是炫技,而是真正從第一性原理去做一個(gè)"生命體",而不是一臺(tái)冰冷設(shè)備。很多人覺得這些小細(xì)節(jié)沒必要,但恰恰是這些細(xì)節(jié),決定了用戶是把機(jī)器人當(dāng)作機(jī)器,還是當(dāng)作"人"。
人機(jī)共生背后的技術(shù)基座
硬氪:loi的AI底層架構(gòu)和主流方案有什么不同?它如何實(shí)現(xiàn)"學(xué)習(xí)"和"成長"?
朱圣杰:loi采用的是一種"成長型"架構(gòu),而非預(yù)設(shè)答案的應(yīng)答系統(tǒng)。
它會(huì)像人一樣通過互動(dòng)來學(xué)習(xí)。剛到家時(shí),loi對(duì)你的生活環(huán)境、習(xí)慣、喜好都不了解,需要在日常互動(dòng)中逐漸建立認(rèn)知。它會(huì)主動(dòng)提問、觀察你的反應(yīng)、記住你們之間的對(duì)話,慢慢形成對(duì)你的理解。
這種設(shè)計(jì)的核心在于:讓機(jī)器人的反應(yīng)不僅基于邏輯推理,還包含情緒、本能、好奇心等多個(gè)維度。比如當(dāng)它感到好奇時(shí),會(huì)主動(dòng)探索;當(dāng)它察覺到你的情緒變化時(shí),會(huì)調(diào)整自己的狀態(tài);當(dāng)它長時(shí)間獨(dú)處時(shí),也會(huì)產(chǎn)生類似"無聊"的反應(yīng)。
這些看似"不完美"的行為,恰恰是我們希望loi具備的,它可能不是一個(gè)永遠(yuǎn)正確的助手,而是一個(gè)會(huì)成長、有情緒、需要相互理解的伙伴。
硬氪:硬件壁壘能維持多久?loi在結(jié)構(gòu)上有哪些獨(dú)特設(shè)計(jì)來支撐表情和動(dòng)作?
朱圣杰:硬件優(yōu)勢(shì)在中國速度下可能只能維持12個(gè)月,而真正構(gòu)成長期競爭力的,是整套系統(tǒng)的搭建能力,也就是動(dòng)作如何設(shè)計(jì)、神態(tài)如何精準(zhǔn)表達(dá)。
在結(jié)構(gòu)靈活性上,loi會(huì)是行業(yè)內(nèi)最多的自由度的仿生機(jī)器人。這也并非出于炫技,而是基于對(duì)人類表情與動(dòng)作機(jī)制的深入研究后所做出的取舍。我們希望用更高精度的底層能力,去支撐一種更克制、更偏卡通化的表達(dá)方式,讓情緒呈現(xiàn)的更自然,而不是更復(fù)雜。

更重要的是,它的反應(yīng)幾乎是瞬時(shí)的,不會(huì)有那種"它在思考"的停頓感,就像和真人對(duì)話一樣流暢。這種即時(shí)性和表情的豐富度,讓它顯得更像一個(gè)有情緒、會(huì)呼吸的存在。
當(dāng)然,延遲在初期都避免不了,但我們的目標(biāo)是保持在0.2-0.3秒。
硬氪:這個(gè)0.2-0.3秒的數(shù)值是怎么定出來的?
朱圣杰:基于人類交互節(jié)奏的觀察,人對(duì)毫秒級(jí)的差異其實(shí)并不敏感,但對(duì)反應(yīng)節(jié)奏非常敏感。我們通過大量測試發(fā)現(xiàn),當(dāng)響應(yīng)落在大約0.2到0.3秒這個(gè)區(qū)間時(shí),既不會(huì)感受機(jī)械地過快,也不會(huì)產(chǎn)生遲鈍感,反而更接近人類真實(shí)的互動(dòng)節(jié)奏。
目前,人機(jī)交互的頓挫感主要源于兩方面,其一是機(jī)械結(jié)構(gòu),比如舵機(jī)的響應(yīng)速度和齒輪材質(zhì)等因素;這就要求我們?cè)谟布媳仨氉龅?00分,以彌補(bǔ)運(yùn)控層面的體驗(yàn)損耗。其二是運(yùn)控策略本身,即何時(shí)執(zhí)行動(dòng)作、動(dòng)作時(shí)長、幅度及頻率。
雖然我們暫時(shí)無法消除延遲帶來的落差,但通過優(yōu)化運(yùn)控策略,使動(dòng)作呈現(xiàn)連貫、順滑的節(jié)奏,可以在很大程度上彌合體驗(yàn)差異,讓用戶感受到絲滑的交互質(zhì)感。比如《瘋狂動(dòng)物城》里的Flash,動(dòng)作很慢但非常流暢,反而讓人覺得可愛。
硬氪: 算法和數(shù)據(jù)層面有什么優(yōu)勢(shì)?
朱圣杰:我們的算法優(yōu)勢(shì)不在某一個(gè)模型,而在于數(shù)據(jù)和架構(gòu),前者是壁壘,后者是方法。
第一,此前我創(chuàng)辦的數(shù)據(jù)標(biāo)注公司,四年時(shí)間都專注于人類表情與行為意圖的研究。人類表情可以分為多個(gè)層級(jí),從大類到細(xì)分類,每一種情緒都有獨(dú)特的肌肉運(yùn)動(dòng)模式。這段經(jīng)歷讓我建立了一套完整的標(biāo)注方法論和評(píng)估體系,也正是基于這些經(jīng)驗(yàn),Animotion 從創(chuàng)立之初就明確了數(shù)據(jù)采集和模型訓(xùn)練的方向。
第二,是我們基于第一性原理設(shè)計(jì)的算法架構(gòu)。我們構(gòu)建了一套以 V(Vision)、L(Language)、E(Environment)為核心的統(tǒng)一框架。其中,E(場景)是非常關(guān)鍵的一層,因?yàn)槿嗽谡鎸?shí)世界中的感知與決策,很大程度上都依賴于具體場景,而不僅僅是視覺或語言信息。
在此基礎(chǔ)上,我們的聯(lián)合創(chuàng)始人John進(jìn)一步提出了認(rèn)知與思考層的底層結(jié)構(gòu),使模型不僅能"識(shí)別",還能夠進(jìn)行更接近人類本能的理解與反應(yīng)。
「情感共生」
硬氪:從產(chǎn)品理念到團(tuán)隊(duì)文化,你們都很強(qiáng)調(diào)"共建"。
朱圣杰:是的,公司所有的成員,我們都是loi的建設(shè)者。在Animotion的官網(wǎng)和產(chǎn)品設(shè)計(jì)圖上,我們會(huì)列出每一位貢獻(xiàn)者的名字,讓團(tuán)隊(duì)成員有強(qiáng)烈的成就感——因?yàn)樗麄儾攀莑oi成功的關(guān)鍵。loi第一代產(chǎn)品的后腦勺上還會(huì)有一塊特殊的銘牌,所有參與代碼和設(shè)計(jì)的人都會(huì)留下名字。成員們也可以在社區(qū)中經(jīng)營自己的賬號(hào),分享幕后的故事。
硬氪: 這種感覺聽起來很"硅谷"。
朱圣杰:我把硅谷那些有趣、開放的團(tuán)隊(duì)文化帶了回來,慢慢讓大家形成習(xí)慣。
工程師可以在社交平臺(tái)分享任何對(duì)行業(yè)的觀點(diǎn),只要不涉及機(jī)密。我也會(huì)引導(dǎo)和鼓勵(lì)他們多分享好玩的東西。不過國內(nèi)的工程師普遍還是有些許靦腆。
年輕人大多厭倦了傳統(tǒng)公司里的"形式主義"文化,更在意能否真正做出有意義的東西。所以我們形成了一種張力驅(qū)動(dòng)的"圈子文化",大家辦公時(shí)間都很靈活,沒有打卡制度,當(dāng)有需要共同推進(jìn)的議題出現(xiàn)時(shí),所有人都會(huì)主動(dòng)聚在一起討論。
硬氪: 在你們看來,當(dāng)loi真正進(jìn)入家庭,它和用戶理想的相處狀態(tài)是怎樣的?
朱圣杰:它是"a real family member created by yourself(一個(gè)由你親手創(chuàng)造的真正的家庭成員)"的存在。當(dāng)用戶需要時(shí)它能給出建議,不想理它時(shí)、它也不會(huì)糾纏,作為一個(gè) "在場"體放在家里,這是我覺得最理想的狀態(tài)。
我們希望能通過Animotion的產(chǎn)品,loi只是一個(gè)起點(diǎn),去探索和建立一種人與機(jī)器全新、平等的相處模式,而不是讓機(jī)器人成為一種"負(fù)擔(dān)",讓你不得不去交互的產(chǎn)品。
這種相處模式能根據(jù)用戶性格和每日狀態(tài)自然調(diào)整。如果你是個(gè)i人,loi絕不會(huì)天天追著你聊天,它會(huì)安靜觀察你的表情和行為,等到你愿意抒發(fā)情緒時(shí)再溫柔開啟對(duì)話;而當(dāng)它發(fā)現(xiàn)用戶性格活潑開朗時(shí),也會(huì)像朋友一樣主動(dòng)分享趣事、熱情互動(dòng)。
硬氪:這套交互設(shè)計(jì)的核心邏輯是什么?loi最終能給用戶帶來什么?
朱圣杰:很多年輕人喜歡養(yǎng)寵物,哪怕要承擔(dān)不少責(zé)任——要遛、要喂、要收拾,但正是這些看似麻煩的事,是人與寵物建立深厚情感的關(guān)鍵。但很多AI陪伴產(chǎn)品在做的是去掉或者拋棄這些"麻煩",讓用戶獲得純粹的情緒滿足。這本質(zhì)上只是悅己,而非共生。真正的關(guān)系需要雙向投入,需要你在意對(duì)方的狀態(tài),而不只是從對(duì)方那里索取。
因此,我們?cè)谠O(shè)計(jì)loi時(shí)刻意保留了這種"不完美",它不會(huì)對(duì)所有人都給出千篇一律的回應(yīng)。當(dāng)你出差十天回家時(shí),會(huì)下意識(shí)想"loi這幾天會(huì)不會(huì)孤單",并主動(dòng)跟它打招呼或帶個(gè)小禮物,這種主動(dòng)的關(guān)心,才是關(guān)系的本質(zhì)。
我們希望通過loi,讓更多人重新理解:如何在關(guān)系中獲得真實(shí)的體驗(yàn)和感受。在這個(gè)AI時(shí)代,我們需要重新學(xué)會(huì)如何與他者建立連接,如何在付出中獲得意義。
這些細(xì)膩的情感連接,才是我們最想創(chuàng)造的核心價(jià)值。