gender-guesser 0.4.0
Ez a csomag a Jorg Michael által készített “gender” program (itt leírva) alapadatait használja. Használata elég egyszerű:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
Az eredmény az unknown (név nem található), andy (androgyn), male, female, mostly_male vagy mostly_female közül az egyik lesz. A különbség az ismeretlen és az ismeretlen között az, hogy az előbbi esetében ugyanolyan valószínűséggel találják férfinak, mint nőnek, míg az utóbbi azt jelenti, hogy a nevet nem találták meg az adatbázisban.
Az I18N teljes mértékben támogatott:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Kiegészítésképpen előnyben részesíthetünk bizonyos országokat:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Kiegészítésképpen létrehozhatunk olyan detektort, amely nem nagy- és kisbetű-érzékeny (alapértelmezés szerint nagy- és kisbetű-érzékeny):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Próbáljuk elkerülni a sok detektor létrehozását, mivel minden egyes létrehozás az adatfájl beolvasását jelenti.
Licencek
A generátor kódja a GPLv3 alatt kerül terjesztésre. Az adatfájl nam_dict.txt a GNU Free Documentation License alatt van kiadva.
Changelog
0.3.0 (2016-07-02)
- Távolítsuk el az unknown_value init opciót, mivel szükség esetén nagyon könnyen megvalósítható egy wrapperrel.
- Return unknown, ha a név nem található, és andy, ha egyaránt érvényes a férfi és a női névre.
- Tesztelje a README példákat doctestként.
- Fixálja a hibás országonkénti nemi felismerést a nem iso886-15 nevek esetében, ami az adatfájl UTF-8-ra való konvertálása utáni sorhosszváltozásból ered. Lásd #gh2. Köszönjük @miquelcamprodon.
0.2.0 (2015-12-06)
- Toxot vezetünk be a Python 2 és Python 3 teszteléséhez.
- Python 2 és 3 kompatibilitás.
- Eltávolítottuk az elavult karakterleképező kódot.
A korábbi verziókért lásd sexmachine.
Credits
Ez egy fork a Ferhat Elmas által készített SexMachine csomagból. Azért jött létre, hogy egy Python 3 kompatibilis verziót tudjunk közzétenni a PyPI-n, és hogy néhány további fejlesztést tudjunk hozzáadni anélkül, hogy az eredeti szerzőt hibáztatnánk.
Leave a Reply