Sistemi za preporuku (engl.
Овај чланак је започет или проширен кроз пројекат семинарских радова. Потребно је проверити превод, правопис и вики-синтаксу. Када завршите са провером, допишете да након |проверено=. |
Popularnost ovih sistema naročito je porasla zadnjih godina povećanjem količine informacija koje nas okružuju, te digitalizacijom naše svakodnevnice i pojavom internetskih servisa poput Fejsbuka, Gugla, Amazona, Ibeja i Netfliksa.
Porastom količine informacija koje nas okružuju, pojavljuje se potreba za izdvajanjem, filtriranjem i rangiranjem korisnih informacija. Objekat preporuke mogu biti: knjiga, muzički album, igra, film, novost, itd. Glavni zadatak sistema za preporuku je da identifikuje objekat (predmet) koji je potencijalno koristan ili interesantan za određenu osobu (korisnika). U procesu identifikacije sistem mora predvideti korisnost objekta, uporediti niz takvih korisnosti i odrediti najbolje objekte na temelju tog poređenja.
Problem preporuĉivanja može se formalizirati na sljedeći naĉin. Neka je C skup svih korisnika, a S skup svih objekata koje je moguće preporučiti. Tada se definiše funkcija korisnosti koja predstavlja procenu korisnosti u objekta s za korisnika c:
Pri čemu je R uređeni skup, npr. pozitivnih celih brojeva u intervalu [1, 5] ili realnih brojeva. Tada za svakog korisnika c ∈ C tražimo objekat s' ∈ S koji daje maksimalnu vrednost funkcije:
U sistemima za preporuku funkcija korisnosti se često prikazuje kao rang (ocena), koja pokazuje koliko je određenom korisniku zanimljiv određeni objekat. Npr. korisnik Petar Petrović je ocenio film Matrix ocenom 8 (od 10). Svaki element iz skupa korisika C može se opisati korisničkim profilom koji sadrži različite informacije, karakteristične za pojedinog korisnika. Primer takvih informacija su: doba, pol, prihod, bračno stanje, itd. Takođe na sličan način mogu se opisati elementi iz skupa obekata. Na primeru filmova te informacije mogu biti: ime filma, žanr, trajanje, popis glumaca, režiser, godina izdavanja, itd.
Prema načinu određivanja preporuke, sistemi za preporuku mogu biti:
Sistemi preporuke koji su na osnovu sadržaja, nastoje korisniku preporučiti objekte slične objektima koji su mu bili zanimljivi u prošlosti. Osnova istraživanja ovih sistema nalaze se u područjima dohvata i filtriranja informacija, pri čemu se najčešće koriste metode za poređenje nestrukturiranog teksta.
Princip rada ovog sistema sastoji se u izgradnji „korisničkog profila“ koji sadrži korisnikov interes i sklonosti u obliku atributa. Atributi tog profila se zatim upoređuju s atributima raspoloživih objekata, pa se biraju oni objekti s najvećom sličnosti. Za računanje sličnosti koristi se vektorski prostorni model gde se objekti (dokumenti) prikazuju vektorima u vektorskom prostoru. Vektorski prostor je određen svim rečima koje se pojavljuju u dokumentu, tzv. rečnikom kolekcije. Svaka reč iz rečnika kolekcije predstavlja jednu dimenziju vektorskog prostora. Zbog toga za velike kolekcije dokumenata broj dimenzija može biti izuzetno veliki. Određena istraživanja su išla u smeru smanjivanja broja dimenzija. Fab sistem za preporuku web stranica razlaže web stranicu na najviše 100 ključnih reči, dok Pazzanini i Billsus predlažu predstavljanje dokumenata s najviše 128 ključnih reči.
Prednosti sistema preporuke na osnovu sadržaja su:
Glavni nedostaci ovih sistema su:
Sistemi preporuke na osnovu saradnji preporučuju korisniku objekte koji su bili zanimljivi korisnicima sa sličnim interesima (korisnici sa sličnim ukusom). Sličnost u ukusu između dvoje korisnika računa se na osnovu prošlih odabranih zanimljivih objekata. Osnovna pretpostavka sistema je da korisnici koji su imali sličan interes (ukus) u prošlosti, ima će sličan interes i u budućnosti.
Za razliku od sistema preporuke na osnovu sadržaja, sistem preporuke na osnovu saradnji mogu preporučiti različite vrste objekata koji nisu nužno slični objektima koji su bili zanimljivi korisniku u prošlosti.
Neki od glavnih nedostataka sistama preporuke na osnovu saradnji su:
Hibridni sistemi se razvijaju kako bi se izbegli glavni nedostatci pojedinačnih sistema za preporuku, a nastaju kao kombinacija sistema preporuke na osnovu sadržaja i saradnji. Hibridni sistemi mogu nastati :
Jedan od pristupa u razvoju hibridnog sistema je implementacija dva (ili više) odvojenih sistema preporuke na osnovu sadržaja i/ili saradnji. Takođe u ovom pristupu moguće je koristiti samo rezultate određenog sistema, zavisno od „kvaliteta“ preporuka koja se dobija analizom ocena koje je korisnik dao prethodno preporučenim objektima.
Određeni sistemi zasnivaju se na tipičnim metodama sistema preporuke na osnovu saradnji, ali pritom još za svakog korisnika izgrađuju njegov profil koristeći principe iz metoda sistema preporuke na osnovu sadržaja. Prilikom računanja sličnosti između korisnika ne gledaju se objekti koje su korisnici zajednički ocenili, već se upoređuju korisnički profili. Na ovaj način je izbegnut problem različitosti preporuka. Takođe u ovom slučaju korisniku neće biti preporučivani samo objekti s visokom ocenom drugih korisnika sličnog profila, već i drugi objekti koji su slični samom korisničkom profilu.
Melville, Mooney i Nagarajan Архивирано на сајту Wayback Machine (23. мај 2014) predlažu sadržajno pomognut algoritam saradnje koji za klasifikaciju koristi Bejsov klasifikator (engl. naive Bayes classifier) na temelju kojeg se popunjavaju prazna mesta u matrici ocenjenih objekata. Korisničke preporuke se zatim računaju iz dobijene pseudo matrice ocena, korištenjem težinskog Pearsonovog korelacijskog algoritma (koji daje veću težinu objektima koje je ocenio veći broj korisnika). Ovaj pristup takođe rešava problem različitosti preporuke, te probleme novog objekta ili novog korisnika – tzv. problem hladnog starta (engl. cold start problem).
Sve hibridne sisteme karakteriše stanovita složenost, kao i uvođenje dodatnih parametara u model, uz pomoć kojih se nastoje izbeći svi nedostaci i manjkavosti „jednostavnijih“ sistema na osnovu sadržaja i saradnji.
Da bi generisali tačne personalizovane preporuke, sistemi za preporuku se oslanjaju na detalje ličnih podataka o preferencijama korisnika. Primeri su ocene, sagledavanje istorije onoga što korisnik voli i lični profili. Sistemi preporuke su korisni, međutim rizici vezani za privatnost pri prikupljanju i obradi ličnih podataka često se potcenjuju ili ignoršu. Mnogi korisnici nisu dovoljno svesni, koliko je njihovih podataka prikupljeno, i da li se njhovi podaci prodaju trećim licima, ili se bezbedno čuvaju i koliko dugo.
Filter Bubble je rezultat stanja u kome vebsajt algoritam selektivno nagađa koje informacije korisnik želi da vidi na osnovu informacija o korisniku (kao što su lokacija, search istorije) i, kao rezultat toga, korisnici postaju odvojeni od informacije koje se ne slaže sa njihovim stavovima, efikasno ih izoluje u svojim kulturnim ili ideološkim mehurićima. Prvi primeri toga su personalizovane Gugl-ove pretrage. Termin je izmislio Internet aktivista Eli Pariser u svojoj knjizi istog imena ; „according to Pariser” , korisnici dobijaju manju izloženost suprotstavljanju stavova i izolovani su u svom informacionom mehuru. Pariser povezuje primer u kojem jedan korisnik u Gugl-ovoj pretrazi ukuca " BP " i dobija kao rezultat investicione vesti o British Petroleum, dok je drugi korisnik dobio kao rezultat informacije o Deepwater Horizon oil spill. Ovaj primer pokazuje da su rezultati pretrage "upadljivo drugačiji".
Istraživanje koje se bavi sistemima preporuke je veoma široko područje i na njemu su napravljeni brojni pomaci. Otkrivene su različite nove metode na osnovu saradnji i sadržaju, kao i hibridnom pristupu. Uprkos svim napretcima, potrebna su dodatna poboljšanja metoda za preporučivanje kako bi one bile još bolje i imale širu mogućnost primene.
Dodatna poboljšanja obuhvataju poboljšavanje metoda koje modeluju korisnike (korisničke profile) i objekte preporuke, korišćenjem naprednijih metoda iz područja izvlačenja znanja sekvenci te prepoznavanja uzorka iz toka podataka. Zatim uvođenjem mogućnosti davanja preporuka iz aspekta različitih kriterijuma (engl. multicriteria ratings). Primer, davanje preporuke restorana na osnovu kriterijuma kvalitete usluge, hrane i uređenja restorana.
Prilikom izrade preporuka često nije dovoljno uzimati u obzir samo informacije o objektu preporuke i korisniku za kojeg se izrađuje preporuka. Ponekad je potrebno ugraditi kontekstnu informaciju u sam proces preporučivanja kako bi se korisniku preporučio objekat zavisno o određenim okolnostima. Primer, za preporuku o turističkoj destinaciji zavisno o vremenskom kontekstu, dobijaju se različiti rezultati za različita godišnja doba (npr. za zimu i leto). Uvođenje kontekstne informacije je primer dodatnog proširenja sistema za preporuku te je takođe predmet istraživanja.
Velik broj sistema za preporuku, pre nego što su u stanju novom korisniku dati preporuku, moraju eksplicitno od korisnika zatražiti da oceni nekoliko objekata. Često to može biti i nekoliko desetaka objekata, pa se ovakvo „ponašanje“ sistema smatra nametljivim (engl. intrusiveness) te se nastoji čim više smanjiti. Jedan od fokusa istraživanja je i smanjivanje nametljivosti ovih sistema, gde se nastoji pronaći optimalan broj ocena koje je potrebno dati, kako bi sistem zadržao određenu nivo preciznosti.
Određena istraživanja usmerena su ka detekciji i sprečavanju napada u sistemima preporuke na osnovu sadržaja. Zlonamerni korisnici raznim metodama nastoje uticati na ishode preporuka, zbog čega potrebno uložiti dodatne napore u istraživanje kako bi sistemi postali što robusniji i otporniji na ovakve napade.
Posebno izazovno i zanimljivo predstavlja vrednovanje i poboljšavanje stvarnih sistema koji se koriste u praksi što podrazumeva obrađivanje vrlo velikih skupova korisnika i predmeta, te posluživanje nekoliko miliona korisnika s velikim brojem kvalitetnih preporuka u stvarnom vremenu.
This article uses material from the Wikipedia Српски / Srpski article Sistemi za preporuku, which is released under the Creative Commons Attribution-ShareAlike 3.0 license ("CC BY-SA 3.0"); additional terms may apply (view authors). Садржај је доступан под лиценцом CC BY-SA 4.0 осим ако је другачије наведено. Images, videos and audio are available under their respective licenses.
®Wikipedia is a registered trademark of the Wiki Foundation, Inc. Wiki Српски / Srpski (DUHOCTRUNGQUOC.VN) is an independent company and has no affiliation with Wiki Foundation.