PLLuM

Polski model językowy PLLuM w mObywatelu. Przełom w cyfryzacji administracji publicznej

Polski model językowy PLLuM w mObywatelu. Przełom w cyfryzacji administracji publicznej?

Ministerstwo Cyfryzacji zaprezentowało w ubiegłym tygodniu przełomowe rozwiązanie – polski model językowy PLLuM. Polish Large Language Model to rodzina modeli sztucznej inteligencji stworzona z myślą o przetwarzaniu i generowaniu tekstów w języku polskim. Technologia ma zrewolucjonizować sposób funkcjonowania administracji publicznej, a jej pierwszym wdrożeniem będzie integracja z aplikacją mObywatel, gdzie PLLuM wcieli się w rolę wirtualnego asystenta.

Jak PLLuM pomoże użytkownikom mObywatela

mObywatel to aplikacja, która z każdą aktualizacją oferuje coraz więcej funkcji, co paradoksalnie może utrudniać odnalezienie potrzebnych informacji. Dlatego Resort Cyfryzacji planuje implementację PLLuM jako inteligentnego chatbota, który przeprowadzi użytkowników przez zawiłości aplikacji.

– Chcemy, żeby AI i inne technologie pojawiły się w mObywatelu, a także na stronach gov.pl. Naszym celem jest stworzenie asystenta, czyli chatbota, który pomoże nam odnaleźć się w aplikacji. mObywatel oferuje coraz więcej funkcji, równie szerokie są GOV-owskie strony, co sprawia, że łatwo się w nich zgubić. Zależy więc nam, żeby był asystent, który będzie w stanie przeprowadzić osobę przez aplikację i pomóc w dostępie do informacji – wyjaśnia Pamela Krzypkowska, dyrektorka Departamentu Badań i Innowacji w Ministerstwie Cyfryzacji.

W praktyce oznacza to, że użytkownicy będą mogli zadawać pytania dotyczące wypełniania wniosków, sprawdzania punktów karnych czy informacji o ważności dokumentów, a inteligentny asystent poprowadzi ich przez cały proces.

Wtedy będzie można skorzystać z takiego asystenta obywatela do zapytania na przykład o to, jak lepiej wypełnić wniosek, gdzie znaleźć punkty karne albo informację dotyczącą ważności dowodu osobistego.

Co wyróżnia polski model językowy na tle konkurencji

PLLuM nie jest pojedynczym modelem, lecz całą rodziną rozwiązań dostosowanych do konkretnych potrzeb. Dzięki architekturze MoE (Mixture of Experts) oraz RAG (Retrieval Augmented Generation) umożliwia precyzyjne generowanie i przetwarzanie treści w języku polskim. To, co wyróżnia PLLuM na tle innych modeli językowych, to pełne dostosowanie do specyfiki polszczyzny oraz terminologii administracji publicznej.

Modele PLLuM są elastyczne i skalowalne – wykorzystują od 8 do 70 miliardów parametrów. Mniejsze wersje charakteryzują się większą szybkością działania, co jest kluczowe w sytuacjach, gdy liczy się czas uzyskania odpowiedzi. Z kolei rozbudowane modele oferują wyższą precyzję i kontekstową spójność w rozumieniu zawiłości języka polskiego.

Co istotne, PLLuM bazuje na etycznym pozyskiwaniu danych. Wersje przeznaczone do użytku komercyjnego korzystają z zasobów tekstowych udostępnionych na podstawie licencji udzielonych konsorcjum, a także z materiałów, które zgodnie z polskim i unijnym prawem autorskim mogą być wykorzystane do budowy otwartego modelu.

Jak powstał polski ekosystem modeli językowych

Za rozwój PLLuM odpowiada konsorcjum sześciu podmiotów: Politechniki Wrocławskiej, Instytutu Podstaw Informatyki PAN, Instytutu Slawistyki PAN, Naukowej i Akademickiej Sieci Komputerowej (NASK), Ośrodka Przetwarzania Informacji i Uniwersytetu Łódzkiego. W 2025 roku do projektu dołączą Centralny Ośrodek Informatyki oraz ACK Cyfronet AGH.

Kluczowym elementem projektu było zbudowanie własnego korpusu treningowego obejmującego aż 100 miliardów słów. Dane te zostały zebrane w sposób organiczny, bez generowania syntetycznych treści, co zwiększa ich wartość i wiarygodność. Obejmują one różnorodne źródła – od tekstów literackich, przez dokumenty urzędowe, po zasoby instytucji naukowych.

Lider konsorcjum HIVE – Ośrodek Badań nad Bezpieczeństwem SI w NASK – koordynuje prace wdrożeniowe PLLuM w usługach administracji publicznej. Do tej pory na projekt przeznaczono 14,5 mln zł. Teraz Ministerstwo Cyfryzacji przyzna konsorcjum dodatkową dotację w wysokości 19 mln zł, która umożliwi wdrożenie modelu w administracji publicznej przez nowych partnerów.

Mamy już nie tylko jeden, ale całą rodzinę modeli, czyli Bielika i PLLuM-a. Ważne jest to, że planujemy współpracę, wspólne pozyskiwanie danych, żeby te modele były w stanie ze sobą kooperować.

Jakie będą kolejne zastosowania PLLuM w administracji publicznej

Integracja z mObywatelem to dopiero początek wykorzystania PLLuM w sektorze publicznym. Już w 2025 roku planowane jest wdrożenie tzw. mUrzędnika – asystenta, który zautomatyzuje przetwarzanie dokumentów, analizę treści, wyszukiwanie informacji i wsparcie w udzielaniu odpowiedzi na pytania obywateli.

– Liczymy, że już w tym roku zaczniemy pierwsze wdrożenia, również mUrzędnika. W Ministerstwie Cyfryzacji testowaliśmy go w 2024 roku, czyli osoby w naszym urzędzie miały już pierwsze szkolenia, jak z takim asystentem urzędnika sobie radzić. Chcemy to skalować dalej, nie tylko na urzędy centralne, ale i na urzędy samorządowe, na ośrodki miejskie – zapowiada przedstawicielka resortu.

Innym obszarem, w którym PLLuM znajdzie zastosowanie, jest edukacja. Model ułatwi rozwój aplikacji edukacyjnych, tłumaczeń i pomoże nauczycielom w prowadzeniu angażujących lekcji z wykorzystaniem nowych technologii.

W jaki sposób PLLuM wzmacnia pozycję Polski wśród liderów rozwoju AI

Wykorzystanie PLLuM w różnych obszarach – od edukacji i administracji po sektor prywatny – sprzyja tworzeniu nowoczesnych rozwiązań, które umacniają pozycję Polski wśród liderów rozwoju AI. Wspólnie z modelem Bielik.AI, wspierając się wzajemnie w lepszym procesie trenowania i dalszym pozyskiwaniu oraz otwieraniu danych, mogą promować sztuczną inteligencję „made in Poland”.

Jednym z wyzwań, z którym mierzyli się twórcy PLLuM, było ograniczenie tzw. halucynacji modeli, czyli generowania błędnych informacji. Zastosowano szereg rozwiązań, takich jak dostarczanie większej ilości danych, testy odporności na manipulację oraz połączenie z bazami wiedzy (RAG), co w przyszłości pozwoli modelom korzystać z aktualnych źródeł danych i unikać dezaktualizacji informacji.

Projekt PLLuM to dopiero początek budowy polskiego ekosystemu AI. Kolejne kroki obejmują wdrożenia w administracji, rozwój konsorcjum Hive oraz integrację z systemami wyszukiwania, co umożliwi modelom korzystanie z aktualnych danych internetowych.

Wykorzystanie PLLuM w różnych obszarach sprzyja tworzeniu nowoczesnych rozwiązań, które umacniają pozycję Polski wśród liderów rozwoju AI.

Źródło: Biznes Newseria