pl en
NKJP logo
National Corpus of Polish





  • Adam Przepiórkowski, Mirosław Bańko, Rafał L. Górski, and Barbara Lewandowska-Tomaszczyk, editors. Narodowy Korpus Języka Polskiego. Wydawnictwo Naukowe PWN, Warsaw.
    (in Polish only; CC BY 3.0 Polska license)
  • Łukasz Degórski. Towards the lemmatisation of Polish nominal syntactic groups using a shallow grammar. In: Security and Intelligent Information Systems: International Joint Confererence, SIIS 2011, Warsaw, Poland, June 13-14, 2011, Revised Selected Papers, volume 7053 of Lecture Notes in Computer Science, pp. 370-378, Berlin Heidelberg, 2012. Springer-Verlag.
  • 2011

    • Piotr Pęzik, Providing corpus feedback for translators with the PELCRA search engine for NKJP. In: Goźdź-Roszkowski, Stanisław (ed.), Explorations across Languages and Corpora: PALC 2009, pp. 135-144, Frankfurt am Main, 2011. Peter Lang.
    • Adam Przepiórkowski, Grzegorz Murzynowski.Manual annotation of the National Corpus of Polish with Anotatornia.In: Goźdź-Roszkowski, Stanisław (ed.), Explorations across Languages and Corpora: PALC 2009, pp. 95-104, Frankfurt am Main, 2011. Peter Lang.
    • Adam Przepiórkowski and Piotr Bański, XML Text Interchange Format in the National Corpus of Polish.In: Goźdź-Roszkowski, Stanisław (ed.), Explorations across Languages and Corpora: PALC 2009, pp. 55-65, Frankfurt am Main, 2011. Peter Lang.
    • Danuta Karwańska, Adam Przepiórkowski, On the Evaluation of Two Polish Taggers. In: Goźdź-Roszkowski, Stanisław (ed.), Explorations across Languages and Corpora: PALC 2009, pp. 105-114, Frankfurt am Main, 2011. Peter Lang.
    • Adam Przepiórkowski, Mirosław Bańko, Rafał L. Górski, Barbara Lewandowska-Tomaszczyk, Marek Łaziński, and Piotr Pęzik. National Corpus of Polish. In: Proceedings of the 5th Language & Technology Conference: Human Language Technologies as a Challenge for Computer Science and Linguistics, pages 259–263, Poznań, Poland, 2011.
    • Adam Przepiórkowski and Piotr Bański. Which XML standards for multilevel corpus annotation? In: Human Language Technology. Challenges for Computer Science and Linguistics: 4th Language and Technology Conference, LTC 2009, Poznań, Poland, November 6–8, 2009, Revised Selected Papers, volume 6562 of Lecture Notes in Artificial Intelligence, pages 400–411, Berlin, 2011. Springer-Verlag.
    • Mirosław Bańko. Jubileusz i jubilat w polszczyźnie. In: Polskie dźwięki, polskie słowa, polska gramatyka (system – norma – kodyfikacja), pages 303-314, Wydawnictwo Wydziału Polonistyki UW.
    • Anna Andrzejczuk. Dwoje urodzin to brzmi dziwnie. Norma językowa dotycząca połączeń rzeczowników plurale tantum z liczebnikami a jej realizacja w tekstach. In: Język Polski XCI/4, pp. 273-283.
    • Barbara Lewandowska-Tomaszczyk. Nowe wyzwania w jakościowej i ilościowej metodologii analizy języka. In: Bulletin de La Société Polonaise de Linguistique LXVII, pp. 141-165.
    • Barbara Lewandowska-Tomaszczyk and Paul Wilson. Culture-Based Conceptions of Emotion in Polish and English . In: Goźdź-Roszkowski, Stanisław (ed.), Explorations across Languages and Corpora: PALC 2009, pp. 229-239, Frankfurt am Main, 2011. Peter Lang.


    • Piotr Bański, Adam Przepiórkowski. The TEI and the NCP: the model and its application. In: the proceedings of LREC 2010 workshop on Language Resources: From Storyboard to Sustainability and LR Lifecycle Management (LRSLM2010)
    • Katarzyna Głowińska, Adam Przepiórkowski The Design of Syntactic Annotation Levels in the National Corpus of Polish. In: LREC 2010 proceedings.
    • Rafał L. Górski, Marek Łaziński, Wzór stylu i wzór na styl. Zróżnicowanie stylistyczne tekstów w Narodowym Korpusie Języka Polskiego. In: M. Milewska-Stawiany, E. Rogowska-Cybulska (eds.), Polskie języki. O językach zawodowych i środowiskowych. Materiały VII Forum Kultury Słowa, Gdańsk 2010, pp. 41-55.
    • Agnieszka Patejuk, Adam Przepiórkowski. ISOcat Definition of the National Corpus of Polish Tagset. In: the proceedings of LREC 2010 workshop on (LRT Standards).
    • Adam Przepiórkowski, Rafał L. Górski, Marek Łaziński, Piotr Pęzik. Recent Developments in the National Corpus of Polish. In: LREC 2010 proceedings.
    • Agata Savary, Jakub Waszczuk, Adam Przepiórkowski. Towards the Annotation of Named Entities in the National Corpus of Polish. In: LREC 2010 proceedings.
    • Waszczuk, J., Głowińska, K., Savary, A., Przepiórkowski, A. Tools and Methodologies for Annotating Syntax and Named Entities in the National Corpus of Polish. In: Proceedings of Computational Linguistics - Applications (CLA 2010), Workshop at IMCSIT 2010, Wisła, Poland, October 18-20.
    • Savary, A., Piskorski, J. Lexicons and Grammars for Named Entity Annotation in the National Corpus of Polish. In: Proceedings of the 18th International Conference Intelligent Information Systems (IIS'10), Siedlce, Poland.
    • Szymon Acedański and Adam Przepiórkowski. Towards the adequate evaluation of morphosyntactic taggers. In: Proceedings of the 23rd International Conference on Computational Linguistics (COLING 2010); Poster Session, pages 1–8, Beijing, 2010.
    • Jakub Waszczuk, Katarzyna Głowińska, Agata Savary, and Adam Przepiórkowski. Tools and methodologies for annotating syntax and named entities in the National Corpus of Polish. In: Proceedings of the International Multiconference on Computer Science and Information Technology (IMCSIT 2010): Computational Linguistics – Applications (CLA'10), pages 531–539, Wisła, Poland, 2010. PTI.
    • Adam Przepiórkowski and Piotr Bański. TEI P5 as a text encoding standard for multilevel corpus annotation. In: Proceedings of the Second International Conference on Global Interoperability for Language Resources (ICGL 2010), Hong Kong, pages 133-142.
    • Szymon Acedański. A Morphosyntactic Brill Tagger with Lexical Rules for Inflectional Languages. In: Advances in Natural Language Processing: Proceedings of the 7th International Conference on Natural Language Processing, IceTAL 2010, Reykjavík, Iceland, Berlin: Springer-Verlag.
    • Mirosław Bańko. Jak opracować słownik afektonimów? In: Etnolingwistyka a leksykografia, Opole, Uniwersytet Opolski, 2010, pages 67-81.
    • Anna Andrzejczuk. Korpusy językowe w pracy językoznawcy: nowe możliwości czy droga na manowce? In: Компьютерная лингвистика: научное направление и учебная дисциплина: сборник научных статей. Вып. 1 / В.И. Коваль и др.; ГГУ им. Ф. Скорины. - Гомель: ГГУ им. Ф. Скорины, 2010.
    • Anna Andrzejczuk. Narodowy Korpus Języka Polskiego - teoria i praktyka. Fakty, mity, potrzeby. In: Lingwistyka Porównawcza, Tom 3, 2010, pages 135-143.
    • Barbara Lewandowska-Tomaszczyk, Katarzyna Dziwirek. Complex Emotions and Grammatical Mismatches. A Corpus-Based Study. Berlin, 2010: Mouton de Gruyter.


    • Adam Przepiórkowski, Rafał L. Górski, Barbara Lewandowska-Tomaszczyk and Marek Łaziński. Narodowy Korpus Języka Polskiego. In: Biuletyn Polskiego Towarzystwa Językoznawczego LXV, pp. 47-55.
    • Adam Przepiórkowski, Rafał L. Górski, Marek Łaziński and Piotr Pęzik. Recent Developments in the National Corpus of Polish. In: Jana Levická and Radovan Garabík (eds.), NLP, Corpus Linguistics, Corpus Based Grammar Research: Proceedings of the Fifth International Conference, Smolenice, Slovakia, 25-27 November 2009, Slovko 2009, pp. 302-309
    • Adam Przepiórkowski. TEI P5 as an XML Standard for Treebank Encoding. In: Marco Passarotti, Adam Przepiórkowski, Savina Raynaud and Frank Van Eynde (eds), Proceedings of of the Eighth International Workshop on Treebanks and Linguistic Theories (TLT8), pp. 149-160.
    • Adam Przepiórkowski and Piotr Bański. Which XML standards for multilevel corpus annotation?. In: Zygmunt Vetulani (ed.), Proceedings of LTC 2009, pp. 245-250.
    • Rafał Młodzki and Adam Przepiórkowski. The WSD Development Environment. In: Zygmunt Vetulani (ed.), Proceedings of LTC 2009, pp. 185-189.
    • Adam Przepiórkowski. A comparison of two morphosyntactic tagsets of Polish. In: Violetta Koseska-Toszewa, Ludmila Dimitrova and Roman Roszko, eds., Representing Semantics in Digital Lexicography: Proceedings of MONDILEX Fourth Open Workshop, Warsaw, 29-30 June 2009, pp. 138-144.
    • Barbara Lewandowska-Tomaszczyk, Katarzyna Dziwirek (eds.) Studies in Cognitive Corpus Linguistics. Frankfurt am Main, 2009: Peter Lang.
    • Piotr Bański and Adam Przepiórkowski. Stand-off TEI Annotation: the Case of the National Corpus of Polish. In: the proceedings of the LAW-III workshop at ACL-IJCNLP 2009, Singapore.
    • Rafał L. Górski, Adam Przepiórkowski, Marek Łaziński, Barbara Lewandowska-Tomaszczyk. Polski korpus. In: Academia. Magazyn Polskiej Akademii Nauk, pp. 4-7.
    • Rafał L. Górski, Adam Przepiórkowski, Marek Łaziński, Barbara Lewandowska-Tomaszczyk. A Corpus of Polish. In: Academia. The Magazine of the Polish Academy of Sciences. pp. 4-7.
    • Marek Łaziński. Liczba gramatyczna polskich rzeczowników osobowych a ich odniesienie, In: T. Berger, M. Giger, S. Kurt, I. Mendoza (eds.) Von gramamtischen Kategorien und sprachlichen Weltbildern. Festschrift für Daniel Weiss zum 60. Geburtstag, Wiener slawistischer Almanach. Sonderband 73, München – Wien, pp. 399-409.


    • Adam Przepiórkowski, Rafał L. Górski, Barbara Lewandowska-Tomaszczyk and Marek Łaziński. Towards the National Corpus of Polish. In the proceedings of the 6th Language Resources and Evaluation Conference (LREC 2008), Marrakesh, Morocco.
    • Adam Przepiórkowski. Linguistic resources and tools at ICS PAS: Towards interoperability. In: M. A. Kłopotek, A. Przepiórkowski, S. T. Wierzchoń and K. Trojanowski (eds.), Intelligent Information Systems, Akademicka Oficyna Wydawnicza EXIT, Warsaw, pp. 491-499.
    • Rafał L. Górski. Representativness of the written part of a Polish general reference corpus. Primary notes. In: B. Lewandowska-Tomaszczyk (ed.) Corpus Linguistics, Computer Tools, and Applications – State of the Art, Frankfurt a. Main: Peter Lang, pp. 119-123.
    © National Corpus of Polish 2008-2012
    Research funded in 2007-2012 by a research and development grant
    from the Polish Ministry of Science and Higher Education.
    design by enkrotka