Scoring-Algorithmen: Wie konvertiert man die Anzahl &% von "Likes" & "Dislikes" in eine einzige Punktzahl?

8

Ich habe eine Website, auf der Nutzer "mögen" und "nicht mögen" können.

Also habe ich für jeden Gegenstand Daten wie die Gesamtzahl der "Likes" und den Prozentsatz der Gesamtstimmen, die "Likes" sind.

Ich möchte nur eine einzige Punktzahl berechnen, die den Nutzern angezeigt wird. Die Verwendung von nur% würde nicht funktionieren, obwohl Element_A 90% von "Likes" haben könnte, während Element_B 80% von "Likes" haben könnte, sollte item_B immer noch vor item_A rangieren, wenn item_B 10.000 Gesamtstimmen hat, während item_A nur hat 1.000 Gesamtstimmen.

Auch die Verwendung von nur "Likes" würde nicht funktionieren, denn während ein Gegenstand eine große Anzahl von "Likes" hat, sollte er nicht sehr hoch sein, wenn der Prozentsatz von "Likes" niedrig ist.

Was wäre ein guter Algorithmus, um aus den obigen Daten einen einzigen Score zu erstellen?

Idealerweise sollte der Score in irgendeiner Weise "sinnvoll" oder "normalisiert" sein. Wenn ich zum Beispiel zu IMDB gehe und sehe, dass ein Film eine Punktzahl von 8/10 hat, würde ich sofort wissen, dass es ein guter Film ist. Andererseits, wenn ich eine Punktzahl von 1.370 sehe, würde ich nicht unbedingt wissen, ob das gut oder schlecht ist.

    
Continuation 02.12.2010, 02:15
quelle

3 Antworten

8
___ antwort4331161 ___

Vielleicht können Sie eine prozentuale Statistik verwenden, aber dann entsprechend dem Volumen färben? z.B. rot / orange / gelb für die höchste Anzahl von Interesse, blau / grün / lila für niedrigste Interesse, und dann erlauben Sie dem Benutzer, nach Prozentsatz oder Farbe zu sortieren.

    
___ qstnhdr ___ Scoring-Algorithmen: Wie konvertiert man die Anzahl &% von "Likes" & "Dislikes" in eine einzige Punktzahl? ___ tag123algorithm ___ Ein Algorithmus ist eine Folge wohldefinierter Schritte, die eine abstrakte Lösung für ein Problem definieren. Verwenden Sie dieses Tag, wenn sich Ihr Problem auf den Algorithmusentwurf bezieht. ___ tag123socialnetworking ___ Dieses Tag befasst sich nicht mit Social-Media-Problemen. Es betrifft die Analyse von Netzwerken, eine formale mathematische Struktur. Ein soziales Netzwerk besteht aus Individuen (zB Menschen, Organisationen), die durch eine oder mehrere spezifische Arten von Beziehungen verbunden sind (wie Freundschaft, Verwandtschaft, gemeinsames Interesse, finanzieller Austausch, Abneigung oder Ratssuche). ___ answer4339634 ___

Bayes'sche Bewertung passt perfekt zu dem, was Sie tun möchten. Es kümmert sich um die weniger Stimmen, aber ein höheres Rating-Problem.

Bayes'sche Bewertung verwendet den Bayesianischen Durchschnitt. Dies ist ein mathematischer Begriff, der eine Bewertung eines Gegenstands basierend auf der "Glaubwürdigkeit" der Stimmen berechnet. Je größer die Gewissheit basierend auf der Anzahl der Stimmen ist, desto mehr nähert sich das Bayes'sche Rating dem einfachen, ungewichteten Rating an. Wenn es nur sehr wenige Stimmen gibt, liegt die bayesianische Bewertung eines Artikels näher an der durchschnittlichen Bewertung aller Artikel.

Verwenden Sie diese Gleichung:

br = ((mittelwert_votes * mittelwert) + (this_num_votes * this_rating)) / (avg_num_votes + this_num_votes)

Legende:

avg_num_votes: Die durchschnittliche Anzahl der Stimmen aller Artikel mit num_votes & gt; 0
avg_rating: Die durchschnittliche Bewertung jedes Elements (wiederum von denen, die num_votes & gt; 0 haben)
this_num_votes: Anzahl der Stimmen für diesen Gegenstand
this_rating: Die Bewertung dieses Artikels

Hinweis: avg_num_votes wird in dieser Formel als "magisches" Gewicht verwendet. Je höher dieser Wert ist, desto mehr Stimmen werden benötigt, um den bayesischen Ratingwert zu beeinflussen.

Sie können mehr hier

lesen     
___ tag123voting ___ hilf uns, dieses Wiki zu bearbeiten ___ tag123scoring ___ ** Scoring ** ist eine Anwendung von Machine Learning. Ein ** Modell **, das aus früheren Beobachtungen aufgebaut wurde, wird auf neue Eingaben angewendet, was zu einer ** Klassifizierung ** (z. B. positives oder negatives Testergebnis) oder zu einer ** Vorhersage ** (z. B. Verkaufspreis eines Hauses) führt. ___ qstntxt ___

Ich habe eine Website, auf der Nutzer "mögen" und "nicht mögen" können.

Also habe ich für jeden Gegenstand Daten wie die Gesamtzahl der "Likes" und den Prozentsatz der Gesamtstimmen, die "Likes" sind.

Ich möchte nur eine einzige Punktzahl berechnen, die den Nutzern angezeigt wird. Die Verwendung von nur% würde nicht funktionieren, obwohl Element_A 90% von "Likes" haben könnte, während Element_B 80% von "Likes" haben könnte, sollte item_B immer noch vor item_A rangieren, wenn item_B 10.000 Gesamtstimmen hat, während item_A nur hat 1.000 Gesamtstimmen.

Auch die Verwendung von nur "Likes" würde nicht funktionieren, denn während ein Gegenstand eine große Anzahl von "Likes" hat, sollte er nicht sehr hoch sein, wenn der Prozentsatz von "Likes" niedrig ist.

Was wäre ein guter Algorithmus, um aus den obigen Daten einen einzigen Score zu erstellen?

Idealerweise sollte der Score in irgendeiner Weise "sinnvoll" oder "normalisiert" sein. Wenn ich zum Beispiel zu IMDB gehe und sehe, dass ein Film eine Punktzahl von 8/10 hat, würde ich sofort wissen, dass es ein guter Film ist. Andererseits, wenn ich eine Punktzahl von 1.370 sehe, würde ich nicht unbedingt wissen, ob das gut oder schlecht ist.

    
___ antwort4331192 ___

Es gibt ein paar sehr gute Artikel darüber, wie Reddit diese Art von Ranking macht hier und hier . Kurz gesagt, ranken Beiträge am unteren Ende des 90% -Konfidenzintervalls ihrer Punkte. Einträge mit weniger Stimmen haben größere Konfidenzintervalle und neigen daher dazu, niedriger zu rangieren als Einträge mit mehr Stimmen, aber demselben Durchschnitt.

    
___
Nick Johnson 02.12.2010, 02:40
quelle
8

Bayes'sche Bewertung passt perfekt zu dem, was Sie tun möchten. Es kümmert sich um die weniger Stimmen, aber ein höheres Rating-Problem.

Bayes'sche Bewertung verwendet den Bayesianischen Durchschnitt. Dies ist ein mathematischer Begriff, der eine Bewertung eines Gegenstands basierend auf der "Glaubwürdigkeit" der Stimmen berechnet. Je größer die Gewissheit basierend auf der Anzahl der Stimmen ist, desto mehr nähert sich das Bayes'sche Rating dem einfachen, ungewichteten Rating an. Wenn es nur sehr wenige Stimmen gibt, liegt die bayesianische Bewertung eines Artikels näher an der durchschnittlichen Bewertung aller Artikel.

Verwenden Sie diese Gleichung:

br = ((mittelwert_votes * mittelwert) + (this_num_votes * this_rating)) / (avg_num_votes + this_num_votes)

Legende:

avg_num_votes: Die durchschnittliche Anzahl der Stimmen aller Artikel mit num_votes & gt; 0
avg_rating: Die durchschnittliche Bewertung jedes Elements (wiederum von denen, die num_votes & gt; 0 haben)
this_num_votes: Anzahl der Stimmen für diesen Gegenstand
this_rating: Die Bewertung dieses Artikels

Hinweis: avg_num_votes wird in dieser Formel als "magisches" Gewicht verwendet. Je höher dieser Wert ist, desto mehr Stimmen werden benötigt, um den bayesischen Ratingwert zu beeinflussen.

Sie können mehr hier

lesen     
CyberStudent 02.12.2010 20:41
quelle
1
___ antwort4331161 ___

Vielleicht können Sie eine prozentuale Statistik verwenden, aber dann entsprechend dem Volumen färben? z.B. rot / orange / gelb für die höchste Anzahl von Interesse, blau / grün / lila für niedrigste Interesse, und dann erlauben Sie dem Benutzer, nach Prozentsatz oder Farbe zu sortieren.

    
___ qstnhdr ___ Scoring-Algorithmen: Wie konvertiert man die Anzahl &% von "Likes" & "Dislikes" in eine einzige Punktzahl? ___ tag123algorithm ___ Ein Algorithmus ist eine Folge wohldefinierter Schritte, die eine abstrakte Lösung für ein Problem definieren. Verwenden Sie dieses Tag, wenn sich Ihr Problem auf den Algorithmusentwurf bezieht. ___ tag123socialnetworking ___ Dieses Tag befasst sich nicht mit Social-Media-Problemen. Es betrifft die Analyse von Netzwerken, eine formale mathematische Struktur. Ein soziales Netzwerk besteht aus Individuen (zB Menschen, Organisationen), die durch eine oder mehrere spezifische Arten von Beziehungen verbunden sind (wie Freundschaft, Verwandtschaft, gemeinsames Interesse, finanzieller Austausch, Abneigung oder Ratssuche). ___ answer4339634 ___

Bayes'sche Bewertung passt perfekt zu dem, was Sie tun möchten. Es kümmert sich um die weniger Stimmen, aber ein höheres Rating-Problem.

Bayes'sche Bewertung verwendet den Bayesianischen Durchschnitt. Dies ist ein mathematischer Begriff, der eine Bewertung eines Gegenstands basierend auf der "Glaubwürdigkeit" der Stimmen berechnet. Je größer die Gewissheit basierend auf der Anzahl der Stimmen ist, desto mehr nähert sich das Bayes'sche Rating dem einfachen, ungewichteten Rating an. Wenn es nur sehr wenige Stimmen gibt, liegt die bayesianische Bewertung eines Artikels näher an der durchschnittlichen Bewertung aller Artikel.

Verwenden Sie diese Gleichung:

br = ((mittelwert_votes * mittelwert) + (this_num_votes * this_rating)) / (avg_num_votes + this_num_votes)

Legende:

avg_num_votes: Die durchschnittliche Anzahl der Stimmen aller Artikel mit num_votes & gt; 0
avg_rating: Die durchschnittliche Bewertung jedes Elements (wiederum von denen, die num_votes & gt; 0 haben)
this_num_votes: Anzahl der Stimmen für diesen Gegenstand
this_rating: Die Bewertung dieses Artikels

Hinweis: avg_num_votes wird in dieser Formel als "magisches" Gewicht verwendet. Je höher dieser Wert ist, desto mehr Stimmen werden benötigt, um den bayesischen Ratingwert zu beeinflussen.

Sie können mehr hier

lesen     
___ tag123voting ___ hilf uns, dieses Wiki zu bearbeiten ___ tag123scoring ___ ** Scoring ** ist eine Anwendung von Machine Learning. Ein ** Modell **, das aus früheren Beobachtungen aufgebaut wurde, wird auf neue Eingaben angewendet, was zu einer ** Klassifizierung ** (z. B. positives oder negatives Testergebnis) oder zu einer ** Vorhersage ** (z. B. Verkaufspreis eines Hauses) führt. ___ qstntxt ___

Ich habe eine Website, auf der Nutzer "mögen" und "nicht mögen" können.

Also habe ich für jeden Gegenstand Daten wie die Gesamtzahl der "Likes" und den Prozentsatz der Gesamtstimmen, die "Likes" sind.

Ich möchte nur eine einzige Punktzahl berechnen, die den Nutzern angezeigt wird. Die Verwendung von nur% würde nicht funktionieren, obwohl Element_A 90% von "Likes" haben könnte, während Element_B 80% von "Likes" haben könnte, sollte item_B immer noch vor item_A rangieren, wenn item_B 10.000 Gesamtstimmen hat, während item_A nur hat 1.000 Gesamtstimmen.

Auch die Verwendung von nur "Likes" würde nicht funktionieren, denn während ein Gegenstand eine große Anzahl von "Likes" hat, sollte er nicht sehr hoch sein, wenn der Prozentsatz von "Likes" niedrig ist.

Was wäre ein guter Algorithmus, um aus den obigen Daten einen einzigen Score zu erstellen?

Idealerweise sollte der Score in irgendeiner Weise "sinnvoll" oder "normalisiert" sein. Wenn ich zum Beispiel zu IMDB gehe und sehe, dass ein Film eine Punktzahl von 8/10 hat, würde ich sofort wissen, dass es ein guter Film ist. Andererseits, wenn ich eine Punktzahl von 1.370 sehe, würde ich nicht unbedingt wissen, ob das gut oder schlecht ist.

    
___ antwort4331192 ___

Es gibt ein paar sehr gute Artikel darüber, wie Reddit diese Art von Ranking macht hier und hier . Kurz gesagt, ranken Beiträge am unteren Ende des 90% -Konfidenzintervalls ihrer Punkte. Einträge mit weniger Stimmen haben größere Konfidenzintervalle und neigen daher dazu, niedriger zu rangieren als Einträge mit mehr Stimmen, aber demselben Durchschnitt.

    
___
reuscam 02.12.2010 02:33
quelle