文|未來跡FutureBeauty 陳龍
編輯|吳思馨
不少人懷疑,今年的諾獎“偷懶”了。
除了備受關(guān)注的諾貝爾生理學(xué)或醫(yī)學(xué)獎“MicroRNA”相關(guān)研究外,今年諾貝爾化學(xué)獎、物理學(xué)獎均被AI相關(guān)研究拿下:
2024年諾貝爾化學(xué)獎授予華盛頓大學(xué)的大衛(wèi)·貝克,以表彰其在蛋白質(zhì)設(shè)計方面的貢獻(xiàn),另一半則共同授予谷歌旗下人工智能公司DeepMind(深度思維)的戴米斯·哈薩比斯和約翰·江珀,針對結(jié)合AI(人工智能)模型對蛋白質(zhì)結(jié)構(gòu)預(yù)測領(lǐng)域的研究。
而今年的諾貝爾物理學(xué)獎,則被授予約翰·J·霍普菲爾德(John J. Hopfield)和杰弗里·E·辛頓(Geoffrey E. Hinton),以表彰他們“在實現(xiàn)使用人工神經(jīng)網(wǎng)絡(luò)進(jìn)行機(jī)器學(xué)習(xí)”方面的基礎(chǔ)性發(fā)現(xiàn)和發(fā)明。
逢AI必獲獎,諾獎看似在躺平式“響應(yīng)”AI這一時代主題,但并非諾獎評委有意“怠工”,而是恰恰說明AI早已滲透到了最前沿的科研領(lǐng)域,甚至能起到關(guān)鍵革新作用。
正如此次獲獎的DeepMind開發(fā)的AlphaFold(阿爾法折疊)大模型,早已在醫(yī)藥和美妝使用的蛋白(肽)類成分的開發(fā)中起到關(guān)鍵作用。
但AI在美妝科研端的應(yīng)用,又何止一個AlphaFold。
美妝科研再次踩中諾獎科技
在過去,AI在美妝行業(yè)的應(yīng)用大多都在臺前。
比如歐萊雅集團(tuán)用BeautyGenius為消費者測膚并進(jìn)行個性化推薦,采用CREAITECH生產(chǎn)內(nèi)容;而雅詩蘭黛與微軟合作AI innovation Lab主要用于增強(qiáng)消費者與旗下品牌的關(guān)聯(lián);寶潔早已開始用AI進(jìn)行消費者行為分析,深度輔助市場決策和供應(yīng)鏈管理。
值得一提的還有,作為迪奧、資生堂等397家知名品牌的AI測膚SaaS解決方案供應(yīng)商,美圖宜膚將AI應(yīng)用到基礎(chǔ)研究領(lǐng)域,通過AI對43萬名參與者皮膚狀態(tài)進(jìn)行研究。該研究利用全景式AI測膚系統(tǒng)美圖宜膚識別皺紋發(fā)展和嚴(yán)重程度的關(guān)鍵拐點,發(fā)現(xiàn)了不同年齡層的衰老“拐點”,將深度學(xué)習(xí)技術(shù)應(yīng)用于衰老檢測,建立皮膚維度測量標(biāo)準(zhǔn),并探索影響皮膚特征的靶點,并參與制定、發(fā)布了《?體?膚分齡抗衰?評價標(biāo)準(zhǔn)表》團(tuán)體標(biāo)準(zhǔn)。
顯然,在美妝科研的大幕后,AI早已開始發(fā)光發(fā)熱,尤其是今年獲得諾獎的Deepmind,結(jié)結(jié)實實地“踩”到了美妝科研的腹地。
據(jù)《FBeauty未來跡》了解,AlphaFold已預(yù)測出約100萬個物種的超過2億種蛋白質(zhì)結(jié)構(gòu),幾乎涵蓋科學(xué)界已編錄的每一種蛋白質(zhì)。這意味著,曾因氨基酸排列組合以及折疊方式帶來“維數(shù)災(zāi)難”的蛋白、肽類成分開發(fā),在AI大模型AlphaFold的篩選之下,可以從“大海撈針”變成了“定向預(yù)測”。
如果將開發(fā)一個肽類成分比作買彩票,AlphaFold大模型類似于將過往所有彩票數(shù)字組合(氨基酸組合)和中獎結(jié)果(功效)進(jìn)行統(tǒng)計,并建立一套準(zhǔn)確的算法。當(dāng)科研人員需要某種目標(biāo)功效(特定中獎結(jié)果)時,可以讓AlphaFold預(yù)測出目標(biāo)蛋白、肽類分子的結(jié)構(gòu)(新一期的數(shù)字組合)。
科研人員不用再一次一次實驗測試各種功能蛋白、肽類成分的濕實驗?zāi)J剑ㄙI很多彩票),而是先測算出結(jié)果(干實驗),再通過一次“濕實驗”(買一張彩票)驗證結(jié)果是否達(dá)到預(yù)期的結(jié)果(中獎)。
在抗衰需求推動的肽類成分盛行的當(dāng)下,AlphaFold將過去難度和成本極高的功能蛋白、肽類成分科研工作,變得成本、時間可控,且準(zhǔn)確率更高。
相關(guān)資料顯示,通過AlphaFold預(yù)測的蛋白質(zhì)結(jié)構(gòu)與科學(xué)家之前通過實驗揭示的結(jié)果幾乎一致(約90%)時,《科學(xué)》雜志甚至評論,人工智能技術(shù)讓人類無需實驗即可了解蛋白質(zhì)結(jié)構(gòu)。
據(jù)第十四章品牌創(chuàng)始人梅鶴祥介紹,在新藥物開發(fā)領(lǐng)域,AI的介入可以降低20%的研發(fā)成本,提升20%命中率,并縮短20%研發(fā)周期。在美妝科研領(lǐng)域,AI大模型的應(yīng)用可以讓環(huán)肽一類 “英雄(Hero)成分”的科研至少降低一半開發(fā)成本,縮短3-5年的研發(fā)周期。
更重要的是,AI技術(shù)的介入,正在改變美妝科研的邏輯:過去的科研是通過不斷用濕實驗試錯,從而找到最正確的解決方案。而現(xiàn)在的邏輯已經(jīng)變先給到想要的結(jié)果,讓AI預(yù)測(干實驗),然后用濕實驗驗證正確性。
可以說,AI作為一種高效的統(tǒng)計學(xué)工具,在眾多變量組合中高效且準(zhǔn)確地找到最好的解決方案,極大降低了科研過程中的試錯成本(時間、精力、資源)。
例如過去青蒿素的發(fā)現(xiàn)過程中,需要在青蒿提取物里10000多個有效成分不斷分離,進(jìn)行試驗的驗證,通過10余年的時間,投入大量的人力物力,才找到最終的青蒿素分子,而現(xiàn)在AI技術(shù)的應(yīng)用,可以提升開發(fā)效率。
而現(xiàn)在,上海家化在青蒿素成分在美妝成分應(yīng)用時,采用AI網(wǎng)絡(luò)藥理學(xué)技術(shù)對從青蒿提取物的153種成分、1080個活性靶點中,找到了64個舒緩相關(guān)蛋白,對應(yīng)88個成分,涉及調(diào)控炎癥相關(guān)的蛋白,加速完成了其在美妝行業(yè)應(yīng)用的科研進(jìn)程。
事實上,AI大模型的應(yīng)用,在美妝科研領(lǐng)域的應(yīng)用模式遠(yuǎn)不止于肽類成分的開發(fā),梅鶴祥表示,在類似新藥開發(fā)完整過程的ADMET各不同流程的研究,均已融合相關(guān)的人工智能技術(shù)。
而相關(guān)的AI工具,可以應(yīng)用到美妝科研的方方面面。
這門通過計算機(jī)科技解決生物技術(shù)問題的學(xué)科,被統(tǒng)稱為計算生物學(xué)(Computational Biology,指開發(fā)和應(yīng)用數(shù)據(jù)分析及理論的方法、數(shù)學(xué)建模、計算機(jī)仿真技術(shù)等,用于生物學(xué)、行為學(xué)和社會群體系統(tǒng)的研究的一門學(xué)科)。
近年AI領(lǐng)域的技術(shù)大爆發(fā)和算力暴漲,以及各種大模型的應(yīng)用,讓計算生物學(xué)加速走向科研舞臺。其中,基因序列比較、基因表達(dá)模式的分析到全基因組關(guān)聯(lián)研究等,蛋白開發(fā)都是計算生物學(xué)的具體應(yīng)用。
《深度 | 三問諾獎科技miRNA,如何顛覆美妝研發(fā)?》中提及miR相關(guān)功效成分開發(fā),也會大量運(yùn)用AI來進(jìn)行成分結(jié)構(gòu)預(yù)測。
與此同時,在近年十分熱門的合成生物領(lǐng)域,AI與計算信息學(xué)、生物信息學(xué)在發(fā)酵工程中的跨領(lǐng)域運(yùn)用,也能大大優(yōu)化發(fā)酵前期的菌種篩選、發(fā)酵過程的優(yōu)化放大和發(fā)酵產(chǎn)物與護(hù)膚功效之間的精準(zhǔn)匹配,有效提升了美妝功效成分的開發(fā)效率。
可見,AI已經(jīng)被應(yīng)用幾乎所有最前沿的到美妝科研領(lǐng)域中。
“AI競賽”已開幕,美妝科研迭代加速
對AI應(yīng)用的想象,永遠(yuǎn)不要過于保守。
在具體實操中,美妝企業(yè)對AI的接受程度,遠(yuǎn)比想象中要高。從成分開發(fā),到配方、香味、膚感設(shè)計,直至專業(yè)的定制化服務(wù),均有涉獵:
不難看出,從品牌、到代工、原料企業(yè),均在使用AI完成一些含有巨大變量的預(yù)測,或者大批量個性化的對比工作。以此替代過去需要大量人工和專業(yè)性的工作,提升科研產(chǎn)出效率。
而AI科技的應(yīng)用也讓第三方科研機(jī)構(gòu),在美妝科研領(lǐng)域擁有更為活躍的表現(xiàn)。
僅在蛋白、肽類成分開發(fā)領(lǐng)域,我國就有清華大學(xué)人工智能產(chǎn)業(yè)研究院孵化的AI 制藥企業(yè)華深智藥、北京分子之心、浙江清華長三角研究院、錚信分子生物技術(shù)研發(fā)中心等第三方研發(fā)機(jī)構(gòu)入局。
《FBeauty未來跡》曾在《計算生物學(xué)“神助攻”,肽類原料開發(fā)駛?cè)肟燔嚨馈芬晃闹刑峒埃迦A長三角研究院正式發(fā)布了ACRDC活性肽智能深度數(shù)據(jù)庫,通過KEPLER 90i??計算生物學(xué)平臺建立了靶點數(shù)據(jù)集和天然活性肽數(shù)據(jù)集的智能深度分析與關(guān)聯(lián)預(yù)測體系?;诹龅挠嬎悖ǖ鞍?、肽類成分與受體的結(jié)合程度),開辟了與AlphaFold不同路徑的蛋白、肽類成分開發(fā)路徑。
據(jù)了解,該研究院基于炎癥性衰老前沿靶點的HMGB1的靶向環(huán)肽cIY-8,是首個日化領(lǐng)域直接靶向炎癥性老化的環(huán)肽分子。目前,貝泰妮已經(jīng)與ACRDC展開合作,雙方的合作不僅僅局限于原料定制化、開發(fā),還會越來越多地深入到基礎(chǔ)研究領(lǐng)域。
在國外,哈佛醫(yī)學(xué)院開發(fā)的miniprot以及愛爾蘭生物公司基于人工智能搭建的生物活性肽查找器Magnifier NπΦ也投入了使用,借助AI預(yù)測的肽可使臨床功效驗證的成功率提高至80%。解鎖了共計超過600萬種植物肽的數(shù)據(jù),并發(fā)現(xiàn)PeptiYouth和PeptiStrong成分。
另一方面,一些國內(nèi)外也有許多主流的科技公司,均在開發(fā)一些人工智能模型,能夠直接或間接參與到美妝科研領(lǐng)域。
資本和政策的支持,也在進(jìn)一步加速AI美妝以及各行業(yè)滲透的進(jìn)程。
相關(guān)數(shù)據(jù)顯示,2023年,全球計算生物學(xué)領(lǐng)域發(fā)生82起投資事件,總?cè)谫Y金額約為 93 億人民幣,其中深勢科技、Causaly、騰邁醫(yī)藥、Superluminal Medicines、分子之心和本導(dǎo)基因等企業(yè),均受到了資本市場的青睞。
在國內(nèi),多地已經(jīng)推行鼓勵A(yù)I與各產(chǎn)業(yè)結(jié)合的相關(guān)政策,例如上海市科委制定了《上海市計算生物學(xué)創(chuàng)新發(fā)展行動計劃(2023—2025年)》,設(shè)立了上海市科技創(chuàng)新行動計劃“計算生物學(xué)”專項 ,并于今年4月組織了首屆上海國際計算生物學(xué)創(chuàng)新大賽。
大賽得到了中國科學(xué)院上海藥物研究所原創(chuàng)新藥研究全國重點實驗室、中國銀行上海市分行、華為云計算技術(shù)有限公司、臨港實驗室、上海人工智能研究院、東方美谷企業(yè)集團(tuán)股份有限公司等多家企事業(yè)單位的支持。
在產(chǎn)業(yè)端,Mordor Intelligence發(fā)布的市場研究報告數(shù)據(jù)顯示,全球計算生物學(xué)市場正呈現(xiàn)出強(qiáng)勁的增長勢頭,規(guī)模預(yù)計將從2023年的68億美元增長到2028年的127.2億美元,預(yù)測期間的復(fù)合年增長率為13.33%。其中,北美地區(qū)是最大的市場,美國是行業(yè)內(nèi)領(lǐng)先國家,政府每年用于發(fā)展計算生物學(xué)的平均支出約為1.4 億美元。[2]
在這樣的大背景之下,美妝產(chǎn)學(xué)研鏈條與AI的產(chǎn)業(yè)下沉開啟了雙向奔赴。
AI 加速普及,但仍有 3 大“攔路虎”
雖然美妝科研領(lǐng)域目力所及皆可AI,但事實是,AI還遠(yuǎn)未能發(fā)揮“十成功力”,就像人工智能輔助駕駛一樣,還遠(yuǎn)沒有到人類可以完全“放下方向盤”的階段。
復(fù)旦大學(xué)復(fù)雜體系多尺度研究院院長馬劍鵬就明確表示,蛋白質(zhì)結(jié)構(gòu)預(yù)測技術(shù)AlphaFold2雖然很強(qiáng)大,但還遠(yuǎn)沒有達(dá)到能夠取代實驗的水平。
梅鶴祥也表示,AI目前在美妝科研領(lǐng)域處于輔助階段,還不能真正意義上做到完全替代。
一方面,AI大模型的開發(fā)和培養(yǎng),需要大量穩(wěn)定性數(shù)據(jù)的采集,通過足夠數(shù)量的數(shù)據(jù)進(jìn)行“喂食”學(xué)習(xí),加上精心設(shè)計的算法,才能提升計算結(jié)果的精度,好比給一個嬰兒看了足夠多的水果圖片,并告訴他從什么維度進(jìn)行判斷,經(jīng)過足夠長時間的學(xué)習(xí),他才能在看到水果時作出準(zhǔn)確的判斷。
例如在KEPLER 90i??的建立過程中,清華長三角研究院許多先將多肽進(jìn)行編碼,變成計算機(jī)可識別的語言,從“教孩子認(rèn)字”學(xué)起,才能實現(xiàn)后期對1000多種肽的鑒定。
但目前,一些擁有實力的生物醫(yī)藥企業(yè),均擁有自己的數(shù)據(jù)庫和算法,但數(shù)據(jù)的孤島效應(yīng)使得各方的數(shù)據(jù)和算法兼容性較差。
沒有足夠多量的精準(zhǔn)的數(shù)據(jù)和結(jié)果對應(yīng),會降低干實驗(AI預(yù)測)與濕實驗(實際測試)結(jié)果的一致性。因此,美妝科研只能在一些確定性較高的領(lǐng)域充分“相信”干實驗的結(jié)果。
另一個難題在于,AI美妝科研領(lǐng)域應(yīng)用的準(zhǔn)入門檻較高,相應(yīng)的人才較為匱乏。
由于涉及到大計算機(jī)科學(xué)和生物學(xué)、網(wǎng)絡(luò)藥理學(xué)等多個學(xué)科的跨界,一家公司完全掌握AI模型的應(yīng)用需要數(shù)年的時間,且還需要大量專業(yè)人才的培養(yǎng)。
“用AI的人不太懂生物,懂的人不太會用AI,需要一個學(xué)習(xí)過程?!泵氟Q祥打趣地說道?!八惴ㄊ且粋€黑盒,將藥學(xué)家、生物學(xué)家、算法設(shè)計人員,在企業(yè)內(nèi)整合到一起并不容易?!?/p>
更讓美妝企業(yè)難以適從的是,AI技術(shù)更新迭代太快。
短短6年時間,AlphaFold已經(jīng)完成3次迭代,并不斷增加參數(shù)維度,提升計算的復(fù)雜度。事實上在計算生物學(xué)的研究思路之下,干濕結(jié)合的數(shù)據(jù)閉環(huán)也在不斷迭代,通過“假設(shè)-驗證-優(yōu)化假設(shè)”的方式,不斷提升研發(fā)效率。
技術(shù)的加速迭代,對使用者也提出了更高的要求。
從整體上來看,科研端依舊對AI的應(yīng)用保持積極的態(tài)度。馬劍鵬表示“人工智能技術(shù)是新時代的望遠(yuǎn)鏡,也是顯微鏡” 。顯微在于AI帶來更精準(zhǔn)、高效的研發(fā)模式,而望遠(yuǎn)鏡則指AI在未來大量應(yīng)用的確定性。
雖然目前AI模型還只是美妝科研的一個輔助工具,但可以預(yù)見的是,未來隨著更多企業(yè)的入局,以及AI自身的加速迭代,會有更多實際成果應(yīng)用到美妝領(lǐng)域。
而今年一系列AI相關(guān)諾獎的出爐,正是對AI未來廣闊應(yīng)用前景的一個積極預(yù)言。
注:
[1] 毛開云,江源,袁銀池,張華,周麗萍,江洪波 2023年計算生物學(xué)科技發(fā)展態(tài)勢
[2] Mordor Intelligence. 計算生物學(xué)市場規(guī)模和份額分析- 增長趨勢和預(yù)測(2023-2028)[EB/OL]. [2023-12-25].
校對/桂玉茜