gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Detta paket använder underliggande data från programmet ”gender” av Jorg Michael (beskrivet här). Dess användning är ganska okomplicerad:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Resultatet kommer att vara ett av följande: unknown (name not found), andy (androgynous), male (manlig), female (kvinnlig), mostly_male (mestadels_manlig) eller mostly_female (mestadels_kvinnlig). Skillnaden mellan andy och unknown är att det förstnämnda har visat sig ha samma sannolikhet att vara manlig som att vara kvinnlig, medan det senare betyder att namnet inte hittades i databasen.

I18N stöds fullt ut:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Ovanligtvis kan du ge företräde åt specifika länder:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Ovanligtvis kan du skapa en detektor som inte är skiftlägeskänslig (standard är att vara skiftlägeskänslig):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Försök att undvika att skapa många detektorer, eftersom varje skapande innebär att du läser datafilen.

Licenser

Generatorkoden distribueras under GPLv3. Datafilen nam_dict.txt släpps under GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Remsätt unknown_value init-alternativet, eftersom det kan implementeras mycket enkelt med en wrapper vid behov.
  • Returnerar unknown när namnet inte hittas och andy när det är giltigt lika mycket för både man och kvinna.
  • Testa README-exemplen som doktest.
  • Rättar felaktig landvis könsdetektering för namn som inte äriso886-15 och som kommer från radlängdsändring efter att datafilen konverterats till UTF-8. Se #gh2. Tack @miquelcamprodon.

0.2.0 (2015-12-06)

  • Inför tox för att testa i både Python 2 och Python 3.
  • Python 2 och 3-kompatibilitet.
  • För bort föråldrad kod för teckenmappning.

För tidigare versioner, se sexmachine.

Krediter

Det här är en gaffel av paketet SexMachine av Ferhat Elmas. Den skapades för att kunna publicera en Python 3-kompatibel version på PyPI och för att kunna lägga till ytterligare förbättringar utan att störa originalförfattaren.

Leave a Reply