<dfn id="siuuq"><code id="siuuq"></code></dfn>
<menu id="siuuq"><kbd id="siuuq"></kbd></menu>
  • <menu id="siuuq"><acronym id="siuuq"></acronym></menu>
  • <menu id="siuuq"></menu>
  • <tbody id="siuuq"><nav id="siuuq"></nav></tbody>
    <li id="siuuq"></li>
    <tr id="siuuq"></tr>
    <dd id="siuuq"></dd>
  • <menu id="siuuq"></menu>
    <dfn id="siuuq"><source id="siuuq"></source></dfn><dfn id="siuuq"><dl id="siuuq"></dl></dfn>
    回復(fù)

    推理謎題數(shù)據(jù)集?

    樓主: 238086 | 查看: 2961 | 回復(fù): 8

    發(fā)表于 2023-11-8 00:12:33 廣西| 2023-11-8 15:27編輯 | 來(lái)自小霸王手機(jī)
    大家好,

    我是一名自然語(yǔ)言處理(NLP)方向的科研人員。目前大規(guī)模語(yǔ)言模型(LLM)的推理能力是人工智能(AI)研究的一個(gè)熱點(diǎn)。

    我曾經(jīng)了解過(guò)一些推理故事,玩過(guò)一些偵探游戲,我個(gè)人覺(jué)得推理謎題——尤其是各種信息互相矛盾/互相關(guān)聯(lián)的謎題——非常適合用來(lái)研究LLM用作agent(我也不知道怎么翻譯好)進(jìn)行鏈狀、樹(shù)狀、圖狀的復(fù)雜推理。

    目前世界上的相關(guān)研究并不多,面臨最大的難處是沒(méi)有可用的開(kāi)源數(shù)據(jù)集,因?yàn)椴还_(kāi)的數(shù)據(jù)集會(huì)導(dǎo)致實(shí)驗(yàn)不可復(fù)現(xiàn),這在AI研究中是不被接受的:大部分LLM復(fù)雜推理的工作只能靠作者人工構(gòu)造任務(wù),如排序、24點(diǎn)等,這些小任務(wù)并不能全面反映模型的推理能力;今年初曾有一篇論文與國(guó)外偵探推理網(wǎng)站合作,用網(wǎng)站數(shù)據(jù)做了一個(gè)數(shù)據(jù)集并公開(kāi)發(fā)表(名為T(mén)rue Detective),但形式僅限于選擇題,且故事篇幅較短(一般約200-300個(gè)詞);7月有一篇arxiv預(yù)印版論文在數(shù)據(jù)收集一節(jié)只說(shuō)他們是從網(wǎng)上收集公開(kāi)的謎題,但檢驗(yàn)方式?jīng)]寫(xiě)清楚(實(shí)驗(yàn)結(jié)果只報(bào)了分?jǐn)?shù),文中沒(méi)寫(xiě)清楚是什么分?jǐn)?shù))。

    我希望大家能給我一些建議,有沒(méi)有可能找到開(kāi)源的推理謎題庫(kù)?什么語(yǔ)言都可以,因?yàn)槲业难芯糠较蚴莔ultilinguality(多語(yǔ)言性?),我會(huì)用機(jī)器翻譯模型把謎題翻譯成中英法德等多種語(yǔ)言。

    5

    2

    分享

    1 | 發(fā)表于 2023-11-8 10:22:43 廣東
    一直就在想會(huì)不會(huì)有推理愛(ài)好者大神用謎題訓(xùn)練AI,還真的有人做了
    之前在某發(fā)展史里聽(tīng)說(shuō)推理謎題是國(guó)內(nèi)論壇獨(dú)有的類(lèi)型,國(guó)外推理網(wǎng)站上的題目大多就是像你說(shuō)的那種一分鐘破案級(jí)別的。而且現(xiàn)在推理謎題創(chuàng)作和發(fā)表基本都分散在在論壇、社刊、公眾號(hào)和群之類(lèi),現(xiàn)成的完整謎題庫(kù)是不會(huì)有
    學(xué)院的三百道官方活動(dòng)題和一些優(yōu)質(zhì)謎題不曉得能不能行,還有其他一些曾有大量謎題的論壇,就是版權(quán)有一部分屬于原作者,處理起來(lái)不知道會(huì)不會(huì)比較麻煩

    @名偵探小品 考慮一下賺錢(qián)機(jī)會(huì)(bushi)?
    1 | 發(fā)表于 2023-11-8 16:16:02 陜西| 2023-11-8 16:19編輯
    你們對(duì)版權(quán)風(fēng)險(xiǎn)的要求,是事先就要確保題庫(kù)中的題都不侵權(quán),還是類(lèi)似避風(fēng)港事后侵刪?
    只是數(shù)據(jù)集的話(huà),隔壁推理罪有個(gè)題庫(kù)(不少三分鐘推理題),腦殼也是個(gè)大題庫(kù)(里面有專(zhuān)門(mén)的推理故事分類(lèi)),還有重量不重質(zhì)的33IQ,都可聯(lián)系站長(zhǎng)尋求合作的可能。但這三個(gè),加上學(xué)院的案發(fā)現(xiàn)場(chǎng)邏輯學(xué)院倆板塊,細(xì)摳起來(lái),都有不少未經(jīng)授權(quán)的轉(zhuǎn)載題,之所以還沒(méi)被刪只是還沒(méi)被人舉報(bào)罷了,直接拿去做數(shù)據(jù)集(即使他們的站長(zhǎng)同意也)可能有第三方侵權(quán)風(fēng)險(xiǎn)。
    另外,你想找廣義的puzzle題庫(kù)(包括密碼、腦筋急轉(zhuǎn)彎、謎語(yǔ)、圖形、數(shù)學(xué)趣題、puzzle hunt題型等),還是狹義的“偵探故事”類(lèi)題庫(kù)?若是前者,puzzling.stackexchange.com也是不錯(cuò)的來(lái)源,而且pse社群很重版權(quán),上面的題目都是以CC-BY-SA licence with attribution required發(fā)布,且格式良好,挺適合做數(shù)據(jù)集的,不過(guò)偵探故事類(lèi)題不多
    | 發(fā)表于 2023-11-8 16:23:25 廣東| 發(fā)自安卓客戶(hù)端
    哥們厲害了,雖然我不能提供這個(gè)數(shù)據(jù)庫(kù)或者有關(guān)信息,但是很支持你的研究也很期待推理在新時(shí)代人工智能時(shí)代有新的發(fā)展
    尚未登錄
    您需要登錄后才可以回帖 登錄 | 加入學(xué)院
    <dfn id="siuuq"><code id="siuuq"></code></dfn>
    <menu id="siuuq"><kbd id="siuuq"></kbd></menu>
  • <menu id="siuuq"><acronym id="siuuq"></acronym></menu>
  • <menu id="siuuq"></menu>
  • <tbody id="siuuq"><nav id="siuuq"></nav></tbody>
    <li id="siuuq"></li>
    <tr id="siuuq"></tr>
    <dd id="siuuq"></dd>
  • <menu id="siuuq"></menu>
    <dfn id="siuuq"><source id="siuuq"></source></dfn><dfn id="siuuq"><dl id="siuuq"></dl></dfn>
    大奶无码 | 美女做爱视频免费网站 | 人人干人人操人人射 | 被窝电影网午夜伦电影韩国 | 五月天婷婷小说 |