#23 Badanie pandemii metodą text mining

W dwu­dzie­stym dru­gim odci­nek pod­ca­stu „Efekt Sie­ci” człon­ko­wie zespo­łu DELab UW w pro­jek­cie NGI For­ward opo­wia­da­ją o bada­niu wyzwań tech­no­lo­gicz­nych zwią­za­nych z pan­de­mią koro­na­wi­ru­sa oraz meto­do­lo­gii badania. 

Eks­per­ta­mi w roz­mo­wie z dr Justy­ną Pokoj­ską są Kri­stóf Gyó­di i Michał Paliń­ski, 2/3 zespo­łu, któ­ry opra­co­wał bada­nie pan­de­mii meto­dą text mining (inte­rak­tyw­na pre­zen­ta­cja zawie­ra­ją­ca wyni­ki bada­nia dostęp­na jest na stro­nie pro­jek­tu). Ana­li­ty­cy odpo­wia­da­ją na pyta­nia o:
- zna­cze­nie poję­cia info­de­mii i spo­so­by bada­nia zja­wi­ska,
- taj­ni­ki meto­do­lo­gii text mining oraz fascy­nu­ją­ce i nie­oczy­wi­ste ele­men­ty tej meto­dy,
- czyn­ni­ki, na któ­re powin­no się zwra­cać uwa­gę w pro­ce­sie badań nad tek­stem,
- wyni­ki bada­nia pan­de­mii oraz tym, co moż­na na ich pod­sta­wie powie­dzieć i naszym spo­łecz­nym sta­nie wie­dzy w dobie COVID-19,
- tren­dy, któ­re fluk­tu­owa­ły w cza­sie obję­tym bada­niem,
- etycz­ne aspek­ty ucze­nia na się data scien­ce na zbio­rach danych o zgo­nach,
- zalew prac nauko­wych wąt­pli­wej jakości.

Udostępnij

„Korzystaliśmy głównie z metody web scrapping, która opiera się na automatycznym pobieraniu treści ze stron internetowych. Możemy na przykład stworzyć taki skrypt, który pobiera teksty również z metadanymi, dotyczące wszystkich artykułów z danego okresu. To rozwiązanie ma taką zaletę, że całkowicie możemy kontrolować jakie artykuły nas interesują, z jakiego okresu. Z drugiej strony są też znacznie łatwiejsze czy wygodniejsze rozwiązania, szczególnie, jeśli baza danych udostępnia swoje dane, nie tylko poprzez przeglądarki, ale też API. W tej sposób możemy wygodnie pobrać dane z working papers czy repozytoriów badań naukowych”.

― Kristóf Gyódi, Analityk DELab UW, Wydział Nauk Ekonomicznych UW

„W walce z infodemią ważną rolę odgrywają instytucje zaufania publicznego, jak World Health Organization. Naszym zadaniem w DELabie, w projekcie prowadzonym dla Komisji Europejskiej jest zmapowanie gdzie jest zainteresowanie społeczne w związku z pandemią, tak, żeby w ogóle można było adresować fake newsy czy fałszywe informacje. Jeszcze dwa miesiące temu w debacie publicznej ważkimi tematami było to, czy można odebrać paczkę nadaną z Chin, czy jak długo utrzymują się wirusy na powierzchniach. My w DELabie musimy pokazać gdzie rośnie zainteresowanie społeczne, gdzie ludzie kanalizują swoje zainteresowanie koronawirusem i technologami, które będą pomagać w związku z pandemią”.

― Michał Paliński, Analityk DELab UW, Wydział Nauk Ekonomicznych UW

Słuchaj podcastu na ulubionej platformie

Więcej podcastów

Z Marią Cywińską (Wydział Psychologii UW) o cyfryzacji uczelni.
Z dr Martą Kołodziejską (DELab UW, Wydział Socjologii UW) o aplikacjach mindfulness.
Z dr Moniką Paluch-Ferszt (SLCJ UW) i dr. Tomaszem Krawczykiem (DELab UW, EEN UW) o energetyce jądrowej.
Z Julią Heller (Szkoła Doktorska Nauk Społecznych, Wydział Socjologii UW) o technikach nadzoru w sieci i metodach ich unikania.
Z dr Monika Paluch-Ferszt (SLCJ UW) i dr. Tomaszem Krawczykiem (DELab UW, EEN UW) o energetyce jądrowej.
Przewiń do góry