Anthropic讓Claude學(xué)化學(xué),鷹谷已經(jīng)把AI化學(xué)家裝進(jìn) InDraw 和 InPaper
AI 正在從“會說話”,走向“懂科研”。

過去幾年,大模型主要解決的是語言問題;而未來幾年,真正決定科研AI價值的,將是它是否能夠理解科學(xué)語言、實(shí)驗邏輯和專業(yè)知識體系。
而這,也正是鷹谷過去十余年持續(xù)投入的方向。
一、Anthropic正在讓AI“讀懂化學(xué)”
長期以來,大語言模型優(yōu)勢在于自然語言處理。
它們能夠?qū)懳恼?、總結(jié)資料、生成代碼,卻很難真正理解化學(xué)結(jié)構(gòu)、實(shí)驗數(shù)據(jù)以及復(fù)雜的科研知識。原因很簡單:化學(xué)并不是普通語言。
一個分子結(jié)構(gòu)、一張譜圖、一條反應(yīng)路線,本質(zhì)上都是高度專業(yè)化的信息表達(dá)體系。如果AI無法理解這些信息,就無法真正參與科研工作。在《Making Claude a Chemist》中,Anthropic展示了多個重要方向:
化學(xué)結(jié)構(gòu)理解
NMR譜圖解析
科學(xué)文獻(xiàn)閱讀與推理
這些能力意味著:AI正在從“生成內(nèi)容工具”升級為“科研認(rèn)知工具”。未來科研AI的競爭,可能不再是誰擁有更多參數(shù),而是誰真正理解:化學(xué)語言、實(shí)驗邏輯、科學(xué)知識、科研數(shù)據(jù),而這些能力,恰恰是科研場景長期存在的核心痛點(diǎn)。
二、這些能力,鷹谷早已做進(jìn)真實(shí)科研工具
事實(shí)上,如果仔細(xì)觀察 Anthropic 所展示的方向,會發(fā)現(xiàn)其中許多能力與鷹谷長期布局的方向高度重合。區(qū)別在于:Anthropic 正在探索讓大模型具備這些能力;而鷹谷已經(jīng)把這些能力做成科研人員每天都能使用的工具。
InDraw:讓AI真正理解化學(xué)結(jié)構(gòu)
在科研工作中,化學(xué)結(jié)構(gòu)是最基礎(chǔ)也是最核心的信息載體。然而長期以來,大模型對結(jié)構(gòu)式的理解能力非常有限。為了解決這一問題,鷹谷持續(xù)深耕化學(xué)智能技術(shù),并將相關(guān)能力全面融入 InDraw AI 化學(xué)設(shè)計平臺。
AI化學(xué)結(jié)構(gòu)識別:高精度(99.75%準(zhǔn)確度,基于IUPAC、uob 、 uspto、 jpo 、clef測試集)結(jié)構(gòu)式圖像識別、批量結(jié)構(gòu)圖識別、移動端拍照識別結(jié)構(gòu)式、PPT、論文圖片直接識別,科研人員只需拍照,即可快速獲得可編輯結(jié)構(gòu)。
AI實(shí)驗路線設(shè)計:相比識別結(jié)構(gòu),更重要的是理解結(jié)構(gòu)。InDraw 已將 AI 智能體能力深度融入結(jié)構(gòu)式編輯器。不同于通用大模型依靠語言概率生成答案,InDraw 會結(jié)合真實(shí)反應(yīng)數(shù)據(jù)庫與專業(yè)算法進(jìn)行搜索驗證:推薦關(guān)鍵反應(yīng)步驟、提供反應(yīng)物與催化劑建議、給出溫度、時間、加料順序等實(shí)驗條件,實(shí)現(xiàn)從“設(shè)計分子”到“設(shè)計實(shí)驗”的跨越。
圖注:該功能將于InDraw 8.1正式上線
化學(xué)知識計算與預(yù)測:InDraw 同時集成大量專業(yè)化學(xué)工具:中文IUPAC命名、英文IUPAC命名、pKa預(yù)測、ADMET成藥性預(yù)測、3D結(jié)構(gòu)模擬、HELM大分子編輯、期刊繪圖能力、兼容 ChemDraw、Office 與 WPS等,對于科研人員而言,這些能力已經(jīng)不僅僅是畫圖工具,而是逐步演化為化學(xué)研發(fā)工作臺。

InPaper:讓AI真正理解科研文獻(xiàn)
如果說 InDraw 解決的是化學(xué)結(jié)構(gòu)理解問題,那么 InPaper 解決的則是科研知識理解問題。
科研的知識來源依然是文獻(xiàn)。然而大量文獻(xiàn)知識長期處于非結(jié)構(gòu)化狀態(tài):數(shù)據(jù)隱藏在正文中、結(jié)構(gòu)式存在于圖片里、反應(yīng)條件散落于實(shí)驗部分、生物活性數(shù)據(jù)難以統(tǒng)一整理,即使有大模型,也很難直接利用這些知識。因此,鷹谷推出了 InPaper 文獻(xiàn)結(jié)構(gòu)化平臺。
自動提取科研知識:InPaper 能夠自動識別并提?。夯瘜W(xué)結(jié)構(gòu)式、化學(xué)反應(yīng)式、生物活性數(shù)據(jù)等數(shù)據(jù),將原本難以利用的文獻(xiàn)信息轉(zhuǎn)化為結(jié)構(gòu)化科研資產(chǎn)。
建立企業(yè)專屬知識庫:通過持續(xù)積累文獻(xiàn)數(shù)據(jù),可以快速建立:可全文搜索、結(jié)構(gòu)式和反應(yīng)式搜索的文獻(xiàn)數(shù)據(jù)庫、文獻(xiàn)構(gòu)效關(guān)系數(shù)據(jù)庫,讓企業(yè)過去沉睡在文獻(xiàn)中的知識真正變得可搜索、可分析、可復(fù)用。
對于未來AI科學(xué)家而言,這些知識庫正是其持續(xù)學(xué)習(xí)與推理的重要基礎(chǔ)。
三、未來科研AI競爭的核心,不只是模型
過去幾年,行業(yè)討論最多的是模型參數(shù)規(guī)模。但越來越多實(shí)踐證明:參數(shù)并不直接等于科研能力。真正決定科研AI價值的,往往是以下幾個因素:
是否理解專業(yè)領(lǐng)域語言
化學(xué)結(jié)構(gòu)、譜圖、反應(yīng)式,本質(zhì)上都是專業(yè)語言。AI必須先理解這些語言,才能參與科研。
是否擁有真實(shí)科研場景
科研不同于通用辦公,實(shí)驗失敗、反應(yīng)異常、數(shù)據(jù)缺失、條件優(yōu)化等問題,都需要長期場景積累。
是否擁有高質(zhì)量科研數(shù)據(jù)
未來科研競爭,本質(zhì)上也是數(shù)據(jù)競爭。誰擁有更多真實(shí)、完整、結(jié)構(gòu)化的實(shí)驗數(shù)據(jù),誰就擁有訓(xùn)練下一代科研AI的基礎(chǔ)。
是否擁有高質(zhì)量的陰性數(shù)據(jù)
成功數(shù)據(jù)告訴AI什么可行,而陰性數(shù)據(jù)則告訴AI什么不可行。在藥物研發(fā)、化學(xué)合成和新材料研發(fā)中,大量失敗實(shí)驗往往比成功結(jié)果更具訓(xùn)練價值。
是否能夠形成知識體系
單個模型能力終究有限。真正重要的是:數(shù)據(jù)、知識、工具和智能體之間能否形成閉環(huán)。從實(shí)驗數(shù)據(jù),到文獻(xiàn)知識,再到智能體推理與執(zhí)行,最終構(gòu)建完整的科研智能基礎(chǔ)設(shè)施。
四、Anthropic 下場科研,垂直領(lǐng)域科研軟件的機(jī)會在哪里
每當(dāng)大模型能力升級,總會有人提出同一個問題:
很多軟件公司都被大模型替代了,Anthropic等開始進(jìn)入科研領(lǐng)域后,鷹谷這樣的專業(yè)垂直領(lǐng)域的科研軟件公司還有機(jī)會嗎?
答案或許恰恰相反:AI進(jìn)入科研領(lǐng)域,反而驗證了科研智能化正在成為未來的重要方向。大模型升級導(dǎo)致創(chuàng)業(yè)公司被替代,在軟件研發(fā)板塊確實(shí)頻繁上演,但在化學(xué)科研領(lǐng)域,這套邏輯并不適用,反而會相互協(xié)同,促進(jìn)超級AI科學(xué)家更快速實(shí)現(xiàn)。
1. 語言模型不等于化學(xué)、物理和生物模型
目前大模型理解化學(xué)的主要橋梁是 SMILES 線性字符串,但這種表達(dá)方式將三維分子構(gòu)象、電子效應(yīng)、空間位阻等信息全部壓縮為一串字符,信息丟失是結(jié)構(gòu)性的。面對反應(yīng)選擇性預(yù)測、催化劑設(shè)計等需要深度化學(xué)理解的任務(wù),通用大模型容易犯“看起來合理、實(shí)際錯誤”的低級錯誤。大模型要理解化學(xué)、物理和生物,還要在底層算法和數(shù)據(jù)上持續(xù)深度研究,才會有更大的突破。
2. 公開數(shù)據(jù)遠(yuǎn)遠(yuǎn)不夠
互聯(lián)網(wǎng)擁有海量文本數(shù)據(jù),但化學(xué)、生物醫(yī)藥領(lǐng)域真正高質(zhì)量的科研數(shù)據(jù)其實(shí)十分有限。尤其是實(shí)驗數(shù)據(jù)。大量有價值的數(shù)據(jù),并不在公開論文和數(shù)據(jù)庫中,而是沉淀在企業(yè)實(shí)驗室、高校課題組和科研機(jī)構(gòu)的日常研發(fā)過程中。更重要的是,公開發(fā)表的往往是成功結(jié)果,而大量失敗實(shí)驗、條件優(yōu)化記錄和陰性數(shù)據(jù)通常不會被公開。
但對于AI而言:知道什么有效很重要,知道什么無效往往更重要。未來科研AI的競爭,不僅是誰擁有更多成功數(shù)據(jù),更是誰保存了更多真實(shí)的失敗數(shù)據(jù)。
而這正是鷹谷電子實(shí)驗記錄本InELN 的價值所在。實(shí)驗過程中的原始數(shù)據(jù)、優(yōu)化過程以及陰性數(shù)據(jù)都能夠被完整記錄和持續(xù)積累,形成企業(yè)最寶貴的科研數(shù)據(jù)資產(chǎn),也成為未來AI科學(xué)家的重要基礎(chǔ)。
3. 未來屬于“大模型 + 專業(yè)系統(tǒng)”
Anthropic 展示的是科研AI發(fā)展的重要方向。但從“理解化學(xué)”到“做好科研”,仍然需要專業(yè)系統(tǒng)的支撐。大模型擅長理解與推理,專業(yè)系統(tǒng)負(fù)責(zé)沉淀數(shù)據(jù)、構(gòu)建知識和連接真實(shí)科研場景。兩者不是替代關(guān)系,而是協(xié)同關(guān)系。
對于鷹谷而言,Anthropic 等模型的發(fā)展并不是威脅,而是機(jī)遇。InELN、InDraw、InPaper 等長期積累的數(shù)據(jù)、知識和場景能力,恰恰能夠與不斷進(jìn)步的大模型結(jié)合,共同推動下一代AI科學(xué)家的誕生。
AI入場,恰恰驗證了這條道路
當(dāng) Anthropic 開始研究如何讓 Claude 成為一名“化學(xué)家”時,這不僅意味著 AI for Science 正在進(jìn)入新的階段,也說明整個行業(yè)正在朝著同一個方向發(fā)展:讓AI真正理解科學(xué),讓超級AI科學(xué)家更快到來。
而對于鷹谷來說,這條路并非剛剛開始。從 InELN 沉淀真實(shí)實(shí)驗數(shù)據(jù),到 InDraw 理解化學(xué)結(jié)構(gòu)與反應(yīng),再到 InPaper 構(gòu)建科研知識體系,鷹谷長期布局的核心始終沒有改變:
讓科研數(shù)據(jù)變成知識,讓知識驅(qū)動AI,讓AI服務(wù)科學(xué)發(fā)現(xiàn),打造超級AI科學(xué)家。
免責(zé)聲明
- 凡本網(wǎng)注明“來源:化工儀器網(wǎng)”的所有作品,均為浙江興旺寶明通網(wǎng)絡(luò)有限公司-化工儀器網(wǎng)合法擁有版權(quán)或有權(quán)使用的作品,未經(jīng)本網(wǎng)授權(quán)不得轉(zhuǎn)載、摘編或利用其它方式使用上述作品。已經(jīng)本網(wǎng)授權(quán)使用作品的,應(yīng)在授權(quán)范圍內(nèi)使用,并注明“來源:化工儀器網(wǎng)”。違反上述聲明者,本網(wǎng)將追究其相關(guān)法律責(zé)任。
- 本網(wǎng)轉(zhuǎn)載并注明自其他來源(非化工儀器網(wǎng))的作品,目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對其真實(shí)性負(fù)責(zé),不承擔(dān)此類作品侵權(quán)行為的直接責(zé)任及連帶責(zé)任。其他媒體、網(wǎng)站或個人從本網(wǎng)轉(zhuǎn)載時,必須保留本網(wǎng)注明的作品第一來源,并自負(fù)版權(quán)等法律責(zé)任。
- 如涉及作品內(nèi)容、版權(quán)等問題,請在作品發(fā)表之日起一周內(nèi)與本網(wǎng)聯(lián)系,否則視為放棄相關(guān)權(quán)利。
手機(jī)版
化工儀器網(wǎng)手機(jī)版
化工儀器網(wǎng)小程序
官方微信
公眾號:chem17
掃碼關(guān)注視頻號











采購中心