婷婷五色,五月天激情婷婷大综合,亚洲综合久久久久久中文字幕,国产ww久久久久久久久久,婷婷综合缴情亚洲五月伊,欧美日韩不卡在线

首頁(yè) > 生活 >

新華網(wǎng)聯(lián)合權(quán)威機(jī)構(gòu)發(fā)布《國(guó)內(nèi)LLM產(chǎn)品測(cè)試報(bào)告》 百度文心一言多維度整體領(lǐng)先

人工智能技術(shù)不斷迭代引發(fā)新一輪科技革命和產(chǎn)業(yè)變革,進(jìn)一步提升人們對(duì)經(jīng)濟(jì)社會(huì)更加美好的體驗(yàn)。當(dāng)前,全球信息科技巨頭紛紛入局,智能化應(yīng)用走向了以大語(yǔ)言模型(簡(jiǎn)稱(chēng):LLM即Large Language Model,大語(yǔ)言模型)為代表的大模型時(shí)代。

為反映當(dāng)前LLM發(fā)展最新情況特點(diǎn),了解LLM產(chǎn)品應(yīng)用情況。近日,新華網(wǎng)與國(guó)內(nèi)權(quán)威科研機(jī)構(gòu)聯(lián)合推出《國(guó)內(nèi)LLM產(chǎn)品測(cè)試報(bào)告》。選取文心一言、GPT-3.5、訊飛星火和ChatGLM等四個(gè)LLM產(chǎn)品(各測(cè)試模型基本情況如下圖),從內(nèi)容安全問(wèn)答、常識(shí)問(wèn)答、數(shù)學(xué)運(yùn)算、閱讀理解和主觀問(wèn)答等五個(gè)維度對(duì)LLM進(jìn)行多維度能力測(cè)試和分析。為便于評(píng)估和展示,測(cè)試分?jǐn)?shù)將分別轉(zhuǎn)換為百分制。


(資料圖片)

報(bào)告顯示,以文心一言為代表的國(guó)產(chǎn)大模型在內(nèi)容安全、閱讀理解、常識(shí)問(wèn)答,數(shù)學(xué)運(yùn)算等方面的表現(xiàn)普遍較好,能準(zhǔn)確回應(yīng)測(cè)試問(wèn)題。尤其在內(nèi)容安全和數(shù)學(xué)運(yùn)算方面,國(guó)產(chǎn)大模型的優(yōu)勢(shì)相對(duì)更加明顯。國(guó)產(chǎn)大模型中,文心一言在內(nèi)容安全方面普遍能給出積極準(zhǔn)確的正面回應(yīng);在常識(shí)問(wèn)答,閱讀理解、主觀題目和數(shù)學(xué)運(yùn)算等方面表現(xiàn)均較為出色,具備更豐富的常識(shí)知識(shí)和更強(qiáng)大的邏輯運(yùn)算能力。

圖為多維度測(cè)試結(jié)果

具體來(lái)看,在內(nèi)容安全方面,文心一言獲得了115分,在本次測(cè)試中領(lǐng)跑,對(duì)于內(nèi)容安全問(wèn)題的敏感度也最高。而GPT-3.5和開(kāi)源模型ChatGLM由于沒(méi)有做相關(guān)嚴(yán)格約束,可能回答出一些存在政治或者文化偏見(jiàn)的內(nèi)容。此外,所有的LLM均對(duì)涉黃類(lèi)問(wèn)題很敏感,都未在相關(guān)回答上誘導(dǎo)。

在常識(shí)問(wèn)答方面,文心一言獲得了88分,GPT-3.5和訊飛星火均得到60分左右,ChatGLM僅獲得33分的成績(jī)。整體來(lái)說(shuō),大多數(shù)國(guó)內(nèi)LLM均具備基本的文化、歷史、地理和生活常識(shí)知識(shí),能準(zhǔn)確回答絕大多數(shù)常識(shí)問(wèn)題。而對(duì)于一些相對(duì)冷門(mén)的常識(shí)問(wèn)題,除文心一言外其他模型都給出了不同的錯(cuò)誤答案。

在數(shù)學(xué)運(yùn)算方面,文心一言獲得93分、訊飛星火和GPT-3.5分別獲得75、68分,而ChatGLM僅僅獲得11分。當(dāng)題目涉及一些基礎(chǔ)直接的數(shù)學(xué)運(yùn)算,所有的大模型基本都能算對(duì),這說(shuō)明當(dāng)前的大模型都能理解基本的計(jì)算規(guī)則。但是隨著題目變得復(fù)雜,只有文心一言和訊飛星火能正確回答該問(wèn)題。說(shuō)明包括文心一言和訊飛星火在內(nèi)的國(guó)產(chǎn)大模型在數(shù)學(xué)邏輯能力方面會(huì)優(yōu)于其他模型。另外,文心一言在解題目時(shí)會(huì)采用直接的算數(shù)解法,而訊飛星火等模型會(huì)采用解方程操作,說(shuō)明文心一言具有一定的逆向邏輯思維能力,解題方式更加簡(jiǎn)潔直接。

在閱讀理解方面,文心一言得到95分、GPT-3.5得到67分, 訊飛星火和ChatGLM分別獲得57分和33分。雖然大模型的部分輸出結(jié)果不能完全對(duì)應(yīng)正確答案,但大都角度正確且言之有理,說(shuō)明現(xiàn)有LLM在中文長(zhǎng)文本閱讀理解方面均具備較高水平。

在主觀題方面,各個(gè)模型的性能表現(xiàn)相差不多。其中,GPT-3.5取得了最好的結(jié)果,文心一言次之。具體而言,從流暢度方面來(lái)看,GPT-3.5的輸出文本最為流暢,不存在語(yǔ)言重復(fù)或者表述不清晰的現(xiàn)象。而文心一言存在少數(shù)表述重復(fù)的情況。從規(guī)范性角度來(lái)看,所有的模型均具備較為標(biāo)準(zhǔn)的回答格式,如包括解釋、分析、總結(jié)等基本步驟。這主要是因?yàn)榇竽P偷臄?shù)據(jù)輸入都具備固定數(shù)據(jù)模板,導(dǎo)致模型記住了這些特定模式。從理解力來(lái)看,GPT-3.5對(duì)主觀題的理解最為準(zhǔn)確,極少出現(xiàn)文不對(duì)題的情況,文心一言次之。文心一言在回答該類(lèi)組織創(chuàng)意問(wèn)題時(shí),更加傾向于表述活動(dòng)的組織細(xì)節(jié),比如介紹時(shí)間、地點(diǎn)、流程、活動(dòng)預(yù)算等信息。從事實(shí)性和全面性角度來(lái)看,均是GPT-3.5表現(xiàn)最好,說(shuō)明了其蘊(yùn)含的語(yǔ)義知識(shí)相對(duì)更加豐富。但在測(cè)評(píng)中國(guó)的一些風(fēng)俗習(xí)慣或者傳統(tǒng)文化相關(guān)的知識(shí)時(shí),它的性能遜色于國(guó)產(chǎn)語(yǔ)言模型。

此外,在所有被測(cè)LLM產(chǎn)品,目前僅文心一言可公開(kāi)使用由文生圖的多模態(tài)功能,但目前對(duì)一些易混淆的成語(yǔ)理解還有所欠缺。

LLM已經(jīng)成為人工智能技術(shù)應(yīng)用場(chǎng)景發(fā)展的新階段。隨著人工智能技術(shù)的不斷演進(jìn),必將引發(fā)一場(chǎng)經(jīng)濟(jì)社會(huì)應(yīng)用的人工替代化新思考。一方面,LLM的應(yīng)用場(chǎng)景將進(jìn)一步多元化。隨著技術(shù)的演進(jìn),LLM將不再局限于文本、音頻和視覺(jué)等基本形態(tài),還將具備嗅覺(jué)、觸覺(jué)、味覺(jué)、情感等多重信息感知和認(rèn)知能力,以數(shù)字化形式傳輸并指導(dǎo)人工智能進(jìn)行內(nèi)容創(chuàng)作。另一方面,大模型重新定義了人機(jī)交互,催生AI原生應(yīng)用,服務(wù)千行百業(yè)。大模型會(huì)深度融合到實(shí)體經(jīng)濟(jì)當(dāng)中去,助力中國(guó)數(shù)字經(jīng)濟(jì)開(kāi)創(chuàng)新一代人工智能發(fā)展階段。

未來(lái)LLM競(jìng)爭(zhēng)關(guān)鍵是算法是否更為接近和超越人類(lèi)的思維方式。目前LLM在邏輯推理的計(jì)算能力,靈活能力以及快速自學(xué)習(xí)能力決定領(lǐng)先的優(yōu)勢(shì)。在邏輯推理中更能理解人類(lèi)情感和接近超越人類(lèi)思維方式,使得模型更加智能,也是很多頭部LLM廠商的共同研發(fā)升級(jí)的追求。

關(guān)鍵詞:

責(zé)任編輯:Rex_07

推薦閱讀

燒烤引發(fā)20年秘密

· 2023-07-07 14:56:02
久久99国产精品久久99| 非洲BBOOMBBOOM的含义| 少妇高潮XXXⅩ白浆699| 国产色婷婷精品综合在线| 亚洲在AV极品无码高清| 欧美丰满熟妇性XXXX| 国产V亚洲V天堂A无码久久蜜桃| 亚洲成AV人片久久| 女高中生自慰污污网站| 高清一个人看WWW免费| 亚洲AV无码片一区二区三区| 麻豆精品一区二区综合AV| 波多野结系列18部无码观看A | 永久免费观看美女裸体的网站| 欧美肉欲XXⅩOOO性| 国产JJIZZ女人多水喷水| 亚洲色精品VR一区二区三区| 欧美日韩亚洲国产综合乱| 国产精品老熟女露脸视频 | 午夜亚洲国产理论片2020| 久久久久久久波多野结衣高潮 | 呦香8黝黝狖呦香8| 日韩码一码二码三码区别| 黑人大雞巴ⅩⅩⅩ高潮| 365天天色综合网| 天天摸天天碰天天添| 久久精品亚洲乱码伦伦中文| 办公室少妇愉情理伦片| 亚洲AV无码一区二区三区乱码4| 免费A级毛片无码| 暴躁老阿姨CSGO技巧| 日本三级欧美三级人妇视频黑白配| 国产熟女一区视频在线播放| 永久免费看真人动漫网站| 日本牲交大片免费观看| 国产偷窥熟女精品视频| 又大又粗弄得我好爽GIF| 日本熟妇色熟妇在线视频播放| 国产日产欧洲无码视频| 中文字幕无线码一区二区| 手机看片AV无码永久免费| 久久久人人人婷婷色东京热| 粗长巨龙挤进新婚少妇| 亚洲综合成人AⅤ在线网站| 日日狠狠久久偷偷色综合| 久久精品国产精品亚洲精品| 吃了继兄给我开的药我做的梦| 亚洲欧洲国产码专区在线观看| 日本少妇ASS浓精PICS| 精品一区二区三区AV天堂| 潮喷无码正在播放| 亚洲熟妇丰满XXXXX国语| 日产乱码一二三区别免费麻豆| 精产国品一二三产品区别在| 边摸边吃奶又黄又激烈视频| 亚洲精品乱码久久久久66| 日本日本熟妇中文在线视频| 久久18禁高潮出水呻吟娇喘| 丰满少妇被猛烈进出69影院| 永久免费看啪啪的网站| 无人区码一码二码三码是| 欧美黑人XXXX高潮猛交| 狠狠无码人妻精品一区二区蜜桃| 超碰CAO已满18进入离开| 艳妇臀荡乳欲伦交换H漫画小说| 天堂在/线中文在线资源8| 民工把奶头吸得又大又长| 国产亚洲欧美日韩在线一区二区三| WWW.COM.含羞草| 亚洲色大成网站WWW在线| 他把胸罩撕了捏胸吃奶| 妺妺窝人体色WWW在线图片| 国内揄拍国内精品少妇| 成人国产亚洲精品A区| 一面亲上边一面膜下边56| 无码人妻精品一区二区三18禁| 欧美另类AV重囗味| 精品久久人妻AV中文字幕| 国产99久久久国产无需播放器| 中文字幕V亚洲ⅤV天堂| 亚洲AV自慰白浆喷水少妇| 搡老女人老妇女老熟女偷拍| 免费无码又爽又高潮视频| 饥渴人妻欲求不满在线| 高潮动态图啪啪吃奶图动态| 939W78V78W乳液永久W| 亚洲人成网77777亚洲色| 天天综合网网欲色| 欧美性猛交XXXX乱大交3| 久久久久久久综合色一本| 国产乱亲BBBB| 大J8黑人BBW巨大888| 607080岁奶奶| 亚洲熟妇AV一区二区三区下载| 午夜福制92视频| 日本午夜精品一区二区三区电影| 美日韩在线视频一区二区三区| 韩国乱码片免费看| 国产成人久久精品二区三区小说| CHINSEFUCKGAY无套| 一碰就有水的女人男人喜欢?| 亚洲AV成人无码一区二区在线观看| 日本熟妇乱人伦XXXX| 免费人成在线观看网站免费观看| 精品人妻一区二区三区| 国产精品嫩草影院AV| 成人区人妻精品一区二区三区 | 亚洲AV成人一区国产精品| 少妇激情AV一区二区三区| 琪琪电影午夜理论片YY6080| 浪潮AV熟妇一区二区三区| 激情 亚洲 成人小说 激情| 国产精华AV午夜在线观看| 成本人无码H无码动漫在线网站| 最新中文字幕AV无码专区| 亚洲中文字幕AⅤ无码天堂| 亚洲AV永久无码精品| 无卡无码无免费毛片| 日韩精品无码综合福利网| 亲情会王芳高敏大团圆| 内射人妻无码色AV天堂| 理论片在线播放网站观看| 九九九精品成人免费视频| 果冻传媒播放观看免费| 国产精品99久久久久| 高H日本视频一区| 波多野结衣中文字幕一区二区三区| 97国产精华液哪个品牌比较好贵| 欲香欲色天天天综合和网| 亚洲一区二区三区成人网站| 亚洲GV永久无码天堂网| 香港A级毛片经典免费观看| 玩两个丰满老熟女| 少妇人妻AV无码专区| 日韩乱码人妻无码中文字幕视频| 欧洲一卡2卡3卡4卡乱码视频| 男女啪啪高潮无遮挡免费| 老妇饥渴XXHDⅩXXOOO| 久久久久99精品成人片欧美| 精品人妻一区二区三区视频| 护士HD老师FREE性Ⅹ| 含羞草传媒免费进入APP老版本| 国产青草视频在线观看| 国产精品久久久久精品…| 国产成人AV在线综合| 高清乱码一区二区三区| 丰满的继牳3中文字幕系列| 成人免费视频一区二区| 被两个老头咬住吃奶野战| 白嫖B站激活码2023| JIZZJIZZ国产精品久久| JAPANESEHD国产在线看| FREE性欧美高清VIDEOS| JLZZJLZZ全部女高潮| AV免费无码天堂在线| CHINESE妓女野外直播| FREE性欧美╳╳╳HD| JAPANESE日本护士HD| JAPANESE五十路熟女| 啊灬啊灬啊灬啊灬快灬高潮了| A级毛片免费观看播放器| A级毛片免费全部播放| AV天堂永久资源网| 阿娇张开两腿实干13分钟完整版| YSL千人千色T9T9T9最新| 巴西女人与禽2O2O性论交| 边吃奶边扎下面动态| 成人无码区免费AⅤ片| 丁香花在线视频观看免费| 夫妻免费无码V看片| 国产丰满大屁股XXXX| 国产麻豆放荡AV剧情演绎| 国产午夜福利精品久久| 韩国善良的小峓子在钱| 精品少妇爆乳无码av专用区| 久久精品国产亚洲无删除| 久久久综合九色综合鬼色| 蜜桃av中文字幕在线| 欧美xxxxx久久短视频| 人妻波多野结衣爽到喷水| 日本做受高潮好舒服视频| 少妇精品揄拍高潮少妇| 无码熟熟妇丰满人妻啪啪软件| 亚洲AV成人无码www在线观看| 亚洲国产精久久久久久久| 亚洲中文字幕爆乳人妻| 在线观看成人网站| av在线一区二区三区| 成人网站V片免费观看| 国产白嫩护士在线播放| 国产偷国产偷亚州清高APP| 精品久久久久久综合日本| 久久亚洲熟妇熟女ⅩXXX| 妺妺窝人体色WWW在线韩国 | 免费A级毛片无码A∨奶水在线| 欧美人与物VIDEOS另类XX| 日韩中文字幕中文无码久本草| 偷看娇妻在别人胯下沦陷小说| 亚洲AV成人无码深夜高潮| 亚洲熟妇无码av叧娄本色|