ML

Великі мовні моделі та особиста інформація: проблеми безпеки та шляхи їх вирішення за допомогою анонімізації

У світлі зростаючих можливостей великих мовних моделей (ВММ) виникає нагальна потреба в ефективних методах захисту персональних даних у онлайн-текстах. Існуючі методи анонімізації часто виявляються неефективними проти складних алгоритмів аналізу ВММ, особливо при обробці чутливої інформації, такої як медичні дані. Це дослідження пропонує інноваційний підхід до анонімізації, який поєднує k-анонімність та адверсаріальні методи. Наш підхід спрямований на підвищення ефективності та швидкості анонімізації при збереженні високого рівня захисту даних.

Evaluating machine learning models efficacy in sentiment analysis for Moroccan Darija: An exploration with MAC dataset

Sentiment analysis is an essential technique for classifying and extracting emotions from several data sets.  While many basic methods distinguish between negative and positive emotions, advanced approaches may consider additional categories, such as neutral emotions.  This becomes very important and difficult when we need to deal with less parsed languages and dialects, such as Moroccan Darija.  Our study highlights the nuances of conducting sentiment analysis implementing the MAC dataset, which includes comments in Moroccan Darija.  Our main target is to do comparativ