gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Denne pakke bruger de underliggende data fra programmet “gender” af Jorg Michael (beskrevet her). Dens brug er ret ligetil:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Resultatet vil være et af unknown (navn ikke fundet), andy (androgynous), male, female, mostly_male, eller mostly_female. Forskellen mellem andy og unknown er, at førstnævnte findes at have samme sandsynlighed for at være mand som for at være kvinde, mens sidstnævnte betyder, at navnet ikke blev fundet i databasen.

I18N understøttes fuldt ud:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Der kan desuden gives fortrinsret til bestemte lande:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Der kan desuden oprettes en detektor, der ikke er case sensitive (standard er at være case sensitive):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Søg at undgå at oprette mange detektorer, da hver oprettelse betyder læsning af datafilen.

Licenser

Generatorkoden distribueres under GPLv3. Datafilen nam_dict.txt er udgivet under GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Fjernelse af unknown_value init option, da den kan implementeres meget nemt med en wrapper, hvis det er nødvendigt.
  • Returnerer ukendt, når navnet ikke findes, og andy, når det er gyldigt lige gyldigt for både mand og kvinde.
  • Test README-eksempler som doktests.
  • Fiks forkert landvis kønsdetektion for ikke-iso886-15 navne, der kommer fra ændring af linjelængde efter datafilkonvertering til UTF-8. Se #gh2. Tak @miquelcamprodon.

0.2.0 (2015-12-06)

  • Indkobl tox for at teste i både Python 2 og Python 3.
  • Python 2- og 3-kompatibilitet.
  • Fjern forældet kode til karaktermapper.

For tidligere versioner, se sexmachine.

Kreditter

Dette er en fork af SexMachine-pakken af Ferhat Elmas. Den blev oprettet for at kunne udgive en Python 3-kompatibel version til PyPI og for at kunne tilføje nogle flere forbedringer uden at genere den oprindelige forfatter.

Leave a Reply