gender-guesser 0.4.0
Tämä paketti käyttää Jorg Michaelin ohjelmasta ”gender” (kuvattu täällä) saatuja tietoja. Sen käyttö on melko suoraviivaista:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
Tulos on jokin seuraavista: unknown (nimeä ei löydy), andy (androgyyni), male, female, mostly_male tai mostly_female. Ero tuntemattoman ja tuntemattoman välillä on se, että ensin mainitulla on sama todennäköisyys olla miespuolinen kuin naispuolinen, kun taas jälkimmäinen tarkoittaa, että nimeä ei löytynyt tietokannasta.
I18N on täysin tuettu:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Lisäksi voit antaa etusijan tietyille maille:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Lisäksi voit luoda ilmaisimen, joka ei ole isojen ja pienten kirjainten suhteen herkkä (oletusarvo on isojen ja pienten kirjainten suhteen herkkä):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Yritä välttää monien ilmaisimien luontia, koska jokainen luominen tarkoittaa datatiedoston lukemista.
Lisenssit
Generointikoodi jaetaan GPLv3:n alaisuudessa. Datatiedosto nam_dict.txt on julkaistu GNU Free Documentation License -lisenssin alaisuudessa.
Changelog
0.3.0 (2016-07-02)
- Poistetaan unknown_value init-optio, koska se voidaan tarvittaessa toteuttaa hyvin helposti wrapperilla.
- Palauta unknown, kun nimeä ei löydy, ja andy, kun se kelpaa yhtä lailla sekä miehelle että naiselle.
- Testaa README-esimerkkejä doctesteinä.
- Korjaa virheellinen maakohtainen sukupuolen tunnistus ei-iso886-15-nimille, joka johtuu rivin pituuden muutoksesta sen jälkeen, kun datatiedosto on muunnettu UTF-8:ksi. Katso #gh2. Kiitos @miquelcamprodon.
0.2.0 (2015-12-06)
- Vaijeri toxissa testaamaan sekä Python 2:ssa että Python 3:ssa.
- Python 2 ja 3 yhteensopivuus.
- Poistettu vanhentunut merkkikartoituskoodi.
Esimäiset versiot, katso sexmachine.
Credits
Tämä on haarautunut Ferhat Elmasin SexMachine-paketista. Se luotiin voidakseen julkaista Python 3 -yhteensopivan version PyPI:ssä ja voidakseen lisätä joitakin parannuksia bugittamatta alkuperäistä tekijää.
Leave a Reply