Перайсці да зместу

Semantic Scholar

З Вікіпедыі, свабоднай энцыклапедыі
Semantic Scholar
Выява лагатыпа
URL semanticscholar.org (англ.)
Тып сайта Пошукавая сістэма, бібліяграфічная база даных
Уладальнік Інстытут штучнага інтэлекту Алена
Аўтар Oren Etzioni[d]
Пачатак працы лістапад 2015
Рэйтынг Alexa 758[1]

Semantic Scholar (бел.: Сэма́нтык Ска́лар) — пошукавая платформа і інструмент для даследавання навуковай літаратуры, распрацаваны ў Інстытуце штучнага інтэлекту Алена (ЗША). Публічны запуск адбыўся ў лістападзе 2015 года[2].

Сістэма выкарыстоўвае сучасныя метады апрацоўкі натуральнай мовы і машыннага навучання для падтрымкі даследчага працэсу, напрыклад, шляхам прадастаўлення аўтаматычна згенераваных рэзюмэ навуковых артыкулаў[3]. Станам на верасень 2022 года база даных змяшчала больш за 200 мільёнаў публікацый з усіх галін навукі[4].

Праект пачынаўся як база даных па тэмах інфарматыкі, геанавук і нейранавукі[5]. У 2017 годзе сістэма пачала ўключаць у свой корпус біямедыцынскую літаратуру[5].

Станам на студзень 2018 года корпус Semantic Scholar уключаў больш за 40 мільёнаў артыкулаў. У сакавіку 2018 года кіраўніком праекта стаў Даг Рэйманд, які раней займаўся ініцыятывамі машыннага навучання для платформы Amazon Alexa[6]. У жніўні 2019 года колькасць запісаў узрасла да больш чым 173 мільёнаў пасля дадання звестак з Microsoft Academic Graph[7][8].

У 2020 годзе партнёрства з Выдавецтвам Чыкагскага ўніверсітэта зрабіла ўсе артыкулы, апублікаваныя гэтым выдавецтвам, даступнымі ў корпусе Semantic Scholar[9]. Да канца 2020 года колькасць праіндэксаваных артыкулаў дасягнула 190 мільёнаў[10], а колькасць карыстальнікаў дасягнула сямі мільёнаў у месяц[11].

Semantic Scholar выкарыстоўвае штучны інтэлект для стварэння аднасказовых рэзюмэ навуковай літаратуры (TLDR — англ.: Too Long; Didn't Read). Праект камбінуе машыннае навучанне, апрацоўку натуральнай мовы і машынны зрок для дадання ўзроўню семантычнага аналізу да традыцыйных метадаў аналізу цытавання. Гэта дазваляе здабываць з артыкулаў адпаведныя малюнкі, табліцы і сутнасці[3][12].

Адной з ключавых функцый з’яўляецца «Research Feeds» — адаптыўная сістэма рэкамендацый, якая выкарыстоўвае ІІ для вывучэння інтарэсаў карыстальніка і прапануе новыя даследаванні[13]. Таксама прапануецца «Semantic Reader» — дапоўнены інструмент для чытання, які забяспечвае ўбудаваныя карткі цытавання з аўтаматычна згенераванымі кароткімі рэзюмэ[14].

У адрозненне ад Google Scholar і PubMed, Semantic Scholar распрацаваны для вылучэння найбольш важных і ўплывовых элементаў артыкула і выяўлення схаваных сувязяў паміж тэмамі даследаванняў[15].

Ідэнтыфікатар S2CID

[правіць | правіць зыходнік]

Кожнаму артыкулу, які размяшчаецца ў Semantic Scholar, прысвойваецца ўнікальны ідэнтыфікатар, які называецца Semantic Scholar Corpus ID (скарочана S2CID). Ён выкарыстоўваецца для адназначнай ідэнтыфікацыі навуковых прац.

Напрыклад:

  • Liu Y., Gayle A. A., Wilder-Smith A., Rocklöv J. The reproductive number of COVID-19 is higher compared to SARS coronavirus // Journal of Travel Medicine — 2020. — Vol. 27, Iss. 2. — DOI:10.1093/jtm/taaa021 — S2CID 211099356.

Semantic Scholar з’яўляецца бясплатным для выкарыстання. Адно даследаванне параўнала аб’ём індэкса Semantic Scholar з Google Scholar і паказала, што для артыкулаў, цытуемых другаснымі даследаваннямі ў галіне інфарматыкі, ахоп абодвух індэксаў быў супастаўным[16].

  1. https://web.archive.org/web/20240807185112/https://www.alexa.com/siteinfo/semanticscholar.org
  2. Eunjung Cha, Ariana (3 лістапада 2015). Paul Allen's AI research group unveils program that aims to shake up how we search scientific knowledge. Give it a try. The Washington Post(англ.). Праверана 3 лістапада 2015.
  3. а б Hao, Karen. An AI helps you summarize the latest in AI (англ.). MIT Technology Review (18 лістапада 2020). Праверана 16 лютага 2021.
  4. Matthews, David (1 верасня 2021). Drowning in the literature? These smart software tools can help. Nature(англ.). Праверана 5 верасня 2022.
  5. а б Fricke, Suzanne (12 студзеня 2018). Semantic Scholar. Journal of the Medical Library Association(англ.). 106 (1): 145–147. doi:10.5195/jmla.2018.280. ISSN 1558-9439.
  6. Tech Moves: Allen Instititue Hires Amazon Alexa Machine Learning Leader; Microsoft Chairman Takes on New Investor Role; and More (англ.). GeekWire (2 мая 2018). Праверана 9 мая 2018.
  7. Semantic Scholar (англ.). Semantic Scholar. Праверана 11 жніўня 2019.
  8. AI2 joins forces with Microsoft Research to upgrade search tools for scientific studies (англ.). GeekWire (5 снежня 2018). Праверана 25 жніўня 2019.
  9. The University of Chicago Press joins more than 500 publishers working with Semantic Scholar to improve search and discoverability (англ.). RCNi Company Limited. Праверана 22 лістапада 2021.
  10. Dunn, Adriana (14 снежня 2020). Semantic Scholar Adds 25 Million Scientific Papers in 2020 Through New Publisher Partnerships (PDF). Semantic Scholar(англ.). Архівавана з арыгінала (PDF) 15 лістапада 2021. Праверана 22 лістапада 2021.
  11. Grad, Peter (24 лістапада 2020). AI tool summarizes lengthy papers in a sentence. Tech Xplore(англ.). Праверана 16 лютага 2021.
  12. Bohannon, John (11 лістапада 2016). A computer program just ranked the most influential brain scientists of the modern era. Science(англ.). doi:10.1126/science.aal0371. Праверана 12 лістапада 2016.
  13. Semantic Scholar | Frequently Asked Questions (англ.). Semantic Scholar.
  14. Semantic Scholar | Semantic Reader (англ.). Semantic Scholar.
  15. Baykoucheva, Svetla (2021). Driving Science Information Discovery in the Digital Age(англ.). Chandos Publishing. p. 91. ISBN 978-0-12-823724-3.
  16. Hannousse, Abdelhakim (2021). Searching relevant papers for software engineering secondary studies: Semantic Scholar coverage and identification role. IET Software(англ.). 15 (1): 126–146. doi:10.1049/sfw2.12011. ISSN 1751-8814.