gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Ez a csomag a Jorg Michael által készített “gender” program (itt leírva) alapadatait használja. Használata elég egyszerű:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Az eredmény az unknown (név nem található), andy (androgyn), male, female, mostly_male vagy mostly_female közül az egyik lesz. A különbség az ismeretlen és az ismeretlen között az, hogy az előbbi esetében ugyanolyan valószínűséggel találják férfinak, mint nőnek, míg az utóbbi azt jelenti, hogy a nevet nem találták meg az adatbázisban.

Az I18N teljes mértékben támogatott:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Kiegészítésképpen előnyben részesíthetünk bizonyos országokat:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Kiegészítésképpen létrehozhatunk olyan detektort, amely nem nagy- és kisbetű-érzékeny (alapértelmezés szerint nagy- és kisbetű-érzékeny):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Próbáljuk elkerülni a sok detektor létrehozását, mivel minden egyes létrehozás az adatfájl beolvasását jelenti.

Licencek

A generátor kódja a GPLv3 alatt kerül terjesztésre. Az adatfájl nam_dict.txt a GNU Free Documentation License alatt van kiadva.

Changelog

0.3.0 (2016-07-02)

  • Távolítsuk el az unknown_value init opciót, mivel szükség esetén nagyon könnyen megvalósítható egy wrapperrel.
  • Return unknown, ha a név nem található, és andy, ha egyaránt érvényes a férfi és a női névre.
  • Tesztelje a README példákat doctestként.
  • Fixálja a hibás országonkénti nemi felismerést a nem iso886-15 nevek esetében, ami az adatfájl UTF-8-ra való konvertálása utáni sorhosszváltozásból ered. Lásd #gh2. Köszönjük @miquelcamprodon.

0.2.0 (2015-12-06)

  • Toxot vezetünk be a Python 2 és Python 3 teszteléséhez.
  • Python 2 és 3 kompatibilitás.
  • Eltávolítottuk az elavult karakterleképező kódot.

A korábbi verziókért lásd sexmachine.

Credits

Ez egy fork a Ferhat Elmas által készített SexMachine csomagból. Azért jött létre, hogy egy Python 3 kompatibilis verziót tudjunk közzétenni a PyPI-n, és hogy néhány további fejlesztést tudjunk hozzáadni anélkül, hogy az eredeti szerzőt hibáztatnánk.

Leave a Reply