Explore

Detekcija Govora Mržnje (Hate Speech Detection)

1. Definicija

Detekcija Govora Mržnje je automatski proces kojim sistem analizira tekst (primarno komentare) kako bi identifikovao i označio sadržaj koji je uvredljiv, toksičan, neprimjeren ili predstavlja govor mržnje.

Sadržaj se obično klasificira u dvije osnovne kategorije:

Offensive: Označava da sadržaj vjerovatno krši pravila komunikacije i može biti uvredljiv ili mrzilački.

Acceptable: Označava da je sadržaj prihvatljiv i da ne sadrži problematičan jezik.

Svrha: Primarna svrha ovog KPI-ja je moderacija sadržaja. Pomaže menadžerima zajednice da brzo uoče i reaguju na neprimjerene komentare, kako bi zaštitili reputaciju brenda i održali zdravu online diskusiju.

2. Kako se računa

Ovo je unaprijed izračunata metrika koju analitički sistem dodjeljuje svakom pojedinačnom komentaru.

Podaci za detekciju govora mržnje se nalaze unutar niza sa komentarima, na putanji: _source.comments[n].analytics.hateSpeech (gdje je [n] indeks komentara)

Ovaj objekat sadrži:

label (string): Konačna klasifikacija, npr. "Offensive" ili "Acceptable".

score (numerički): Ocjena pouzdanosti modela (od 0.0 do 1.0) u dodijeljenu label.

Primjer iz podataka (komentar korisnika "razljevaksasirom" na Klix.ba članku):

JSON

"analytics": {

"hateSpeech": {

"label": "Offensive",

"score": 0.9998859167098999

}

Tekst komentara koji je analiziran:

"hoce li iko ikada ukloniti onu visemjesecnu torturu pod nazivom street food market izmedju muzeja? misli li nacelnica izmedju dva selfija kako je onima koji zive tu okolo i ko i sa kakvim talovima moze uopste dobiti dozvolu za taj vise mjesecni dernek do sitnih sati svako vece?"

Sistem je analizirao dati komentar i, zbog fraza poput "višemjesečna tortura" i "dernek do sitnih sati", klasifikovao ga je kao "Offensive" sa izuzetno visokom ocjenom pouzdanosti. Ovo je jasan signal moderatoru da pregleda i potencijalno reaguje na ovaj komentar.

3. Posebne napomene

Ovaj KPI je isključivo vezan za sadržaj koji generišu korisnici (komentari, recenzije) a ne za originalne objave ili članke. Njegovo mjesto unutar comments niza u JSON strukturi to potvrđuje.

Nijedan AI model za detekciju govora mržnje nije savršen. Mogući su "lažno pozitivni" rezultati (kada se bezopasan komentar označi kao uvredljiv). Zato je ljudska supervizija i dalje preporučena. Ocjena score može pomoći u postavljanju praga za eskalaciju (npr. "prikaži mi za reviziju sve komentare sa score > 0.8").

Want to print your doc?
This is not the way.

Try clicking the ··· in the right corner or using a keyboard shortcut (

CtrlP

) instead.