Ključni istraživački interes
- računalno jezikoslovlje
- korpusno jezikoslovlje
- jezične tehnologije
- istraživačke infrastrukture u digitalnim humanističkim znanostima
Članstva u akademijama
-
Hrvatska akademija znanosti i umjetnosti
(član suradnik)
Članstva u profesionalnim udruženjima, stručnim i građanskim udrugama i javnim
tijelima
-
Hrvatsko društvo za jezične tehnologije (HDJT) (Predsjednik)
-
Hrvatsko društvo za primijenjenu lingvistiku (HDPL) (Član)
-
Hrvatsko filološko društvo (HFD) (Član)
-
Matica hrvatska
-
Odbor za leksikografiju, Hrvatska akademija znanosti i umjetnosti (HAZU)
-
Odbor za normu hrvatskoga standardnog jezika, Hrvatska akademija znanosti i umjetnosti (HAZU)
-
Područno znanstveno vijeće za humanističke znanosti, Nacionalno vijeće za znanost, visoko obrazovanje i tehnološki razvoj (NVZVOTR)
-
Vijeće društveno-humanističkog područja, Sveučilište u Zagrebu
Članstva u organizacijskim odborima skupova
-
2020.
1st International Workshop on Cross-lingual Event-centric Open Analytics, ESWC2020 (-, -)
-
2020.
CLIB2020, Institute for Bulgarian Language, Bulgarian Academy of Sciences (-, -)
-
2020.
LREC2020, ELRA (-, -)
-
2020.
NooJ2020, Odsjek za informacijske i komunikacijske znanosti, Filozofski fakultet Sveučilišta u Zagrebu; ELLIADD laboratory of the University of Franche-Comté (-, -)
-
2020.
VarDial2020, COLING2020 (-, -)
-
2019.
CMLC-7, Corpus Linguistics 2019 (-, -)
-
2019.
LTC2019, University of Poznan (-, -)
-
2019.
VarDial2019, NAACL2019 (-, -)
-
2018.
CLIB2018, Institute for Bulgarian Language, Bulgarian Academy of Sciences (-, -)
-
2018.
LREC2018, ELRA (-, -)
-
2018.
VarDial2018, COLING2018 (-, -)
-
2017.
CMLC-5, Corpus Linguistics 2017 (-, -)
-
2017.
LDK2017, Insight Centre for Data Analytics, InfAI (University Leipzig), Wolfgang Goethe University (-, -)
-
2017.
LTC2017, University of Poznan (-, -)
-
2017.
VarDial2017, EACL2017 (-, -)
-
2016.
CLIB2016, Institute for Bulgarian Language, Faculty of Slavic Studies and Faculty of Mathematics and Informatics at Sofia University (-, -)
-
2016.
GRAMM&LEX2016, COLING2016 (-, -)
-
2016.
LREC2016, ELRA (-, -)
-
2016.
NooJ2016, The Department of Romance Languages, Faculty of Philosophy, University of South Bohemia; Le laboratoire ELLIADD de l'Université de Franche-Comté, Besançon; The NOOJ association (-, -)
-
2016.
VarDial2016, COLING2016 (-, -)
Uredništva u časopisima
-
Filologija, Hrvatska akademija znanosti i umjetnosti, Zagreb (član uredničkoga odbora)
-
Filologija, Hrvatska akademija znanosti i umjetnosti, Zagreb (član uredničkoga odbora)
-
Filologija, Hrvatska akademija znanosti i umjetnosti, Zagreb (član uredničkoga odbora)
-
Filologija, Hrvatska akademija znanosti i umjetnosti, Zagreb (član uredničkoga odbora)
-
Filologija, Hrvatska akademija znanosti i umjetnosti, Zagreb (član uredničkoga odbora)
-
Filologija, Hrvatska akademija znanosti i umjetnosti, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
-
Suvremena lingvistika, Hrvatsko filološko društvo, Zagreb (član uredničkoga odbora)
Opis znanstvene djelatnosti
Voditeljem je više domaćih znanstvenih projekata: Hrvatska suradnja u ELAN projektu (1999.-2000.), Računalna obradba hrvatskoga jezika (2000.-2001.), Hrvatsko-slovenski paralelni korpus (2000.-2001.), Razvitak hrvatskih jezičnih resursa (2002.-2006.), Hrvatski jezični resursi i njihovo obilježavanje (2007.-2012.); znanstveno-istraživačkoga programa Računalnolingvistički modeli i jezične tehnologije za hrvatski jezik (2007.-2012.); kao i nekoliko projekata primjene informacijske tehnologije u znanosti: Jezične tehnologije za hrvatski jezik (2000.-2001.), Informatička potpora Hrvatskome nacionalnom korpusu (2000.-2001.), Izgradnja hrvatskoga morfološkoga leksikona (2002.-2003.).
Bio je ili jest voditeljem hrvatskoga sudjelovanja u nekoliko EU projekata: FP7 projekt izgradnje istraživačkih infrastruktura CLARIN (2008.-2011.), FP7 projekt ACCURAT (2010.-2012.), ICT-PSP projekt LetsMT! (2010.-2012.), ICT-PSP projekt CESAR (2011.-2013.), FP7 projekt XLike (2012.-2014.), projekt Europskoga socijalnoga fonda HR4EU (2015.-2016.), CEF projekt MARCELL (2018.-2020.), H2020 MSCA ITN projekt CLEOPATRA (2019.-2022.), EU-Presidency Translation Kit (2019.-2020.), CEF projekt CURLICAT (2020.-2022.), CEF projekt NLTP (2021.-2023.) i ELE-LANGEQ (2021.-2022.), te suradnik na zajedničkom flamansko-hrvatskom projektu CADIAL (2007.-2009.). Nacionalni je koordinator sudjelovanja Republike Hrvatske u europskoj istraživačkoj infrastrukturi CLARIN-ERIC.
U više od stotinu objavljenih znanstvenih, stručnih i enciklopedijskih radova bavi se računalnim jezikoslovljem i računalnom obradbom hrvatskoga jezika. Autorom je knjige "Jezične tehnologije i hrvatski jezik" (2003.), a suautorom knjiga "Hrvatski jezik u digitalnom dobu / The Croatian Language in the Digital Age" (2012.), "Cesarićev rječnik" (2011.), "Research Infrastructures in the Digital Humanities" (2011.) i "Hrvatski čestotni rječnik" (1999.). Također je (su)autorom značajnih mrežnih jezičnih resursa za hrvatski jezik kao što su Hrvatski nacionalni korpus (https://hnk.ffzg.hr), Hrvatski morfološki leksikon (https://hml.ffzg.hr), Hrvatska ovisnosna banka stabala (https://hobs.ffzg.hr), Prevoditelja za predsjedanje Vijećem EU-a (https://hr.presidencymt.eu) kao i portala Jezične tehnologije za hrvatski jezik (https://jthj.ffzg.hr).