gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Tämä paketti käyttää Jorg Michaelin ohjelmasta ”gender” (kuvattu täällä) saatuja tietoja. Sen käyttö on melko suoraviivaista:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Tulos on jokin seuraavista: unknown (nimeä ei löydy), andy (androgyyni), male, female, mostly_male tai mostly_female. Ero tuntemattoman ja tuntemattoman välillä on se, että ensin mainitulla on sama todennäköisyys olla miespuolinen kuin naispuolinen, kun taas jälkimmäinen tarkoittaa, että nimeä ei löytynyt tietokannasta.

I18N on täysin tuettu:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Lisäksi voit antaa etusijan tietyille maille:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Lisäksi voit luoda ilmaisimen, joka ei ole isojen ja pienten kirjainten suhteen herkkä (oletusarvo on isojen ja pienten kirjainten suhteen herkkä):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Yritä välttää monien ilmaisimien luontia, koska jokainen luominen tarkoittaa datatiedoston lukemista.

Lisenssit

Generointikoodi jaetaan GPLv3:n alaisuudessa. Datatiedosto nam_dict.txt on julkaistu GNU Free Documentation License -lisenssin alaisuudessa.

Changelog

0.3.0 (2016-07-02)

  • Poistetaan unknown_value init-optio, koska se voidaan tarvittaessa toteuttaa hyvin helposti wrapperilla.
  • Palauta unknown, kun nimeä ei löydy, ja andy, kun se kelpaa yhtä lailla sekä miehelle että naiselle.
  • Testaa README-esimerkkejä doctesteinä.
  • Korjaa virheellinen maakohtainen sukupuolen tunnistus ei-iso886-15-nimille, joka johtuu rivin pituuden muutoksesta sen jälkeen, kun datatiedosto on muunnettu UTF-8:ksi. Katso #gh2. Kiitos @miquelcamprodon.

0.2.0 (2015-12-06)

  • Vaijeri toxissa testaamaan sekä Python 2:ssa että Python 3:ssa.
  • Python 2 ja 3 yhteensopivuus.
  • Poistettu vanhentunut merkkikartoituskoodi.

Esimäiset versiot, katso sexmachine.

Credits

Tämä on haarautunut Ferhat Elmasin SexMachine-paketista. Se luotiin voidakseen julkaista Python 3 -yhteensopivan version PyPI:ssä ja voidakseen lisätä joitakin parannuksia bugittamatta alkuperäistä tekijää.

Leave a Reply