gender-guesser 0.4.0
Pakiet ten wykorzystuje podstawowe dane z programu „gender” autorstwa Jorga Michaela (opisanego tutaj). Jego użycie jest całkiem proste:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
Wynikiem będzie jedna z wartości unknown (nie znaleziono nazwy), andy (androgyniczny), male, female, mostly_male, lub mostly_female. Różnica między andy a unknown jest taka, że w przypadku tego pierwszego prawdopodobieństwo bycia mężczyzną jest takie samo jak bycia kobietą, podczas gdy to drugie oznacza, że imię nie zostało znalezione w bazie danych.
I18N jest w pełni obsługiwany:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Dodatkowo możesz dać preferencje określonym krajom:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Dodatkowo możesz utworzyć detektor, w którym nie jest rozróżniana wielkość liter (domyślnie rozróżniana jest wielkość liter):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Staraj się unikać tworzenia wielu detektorów, ponieważ każde utworzenie oznacza odczytanie pliku danych.
Licencje
Kod generatora jest rozpowszechniany na licencji GPLv3. Plik danych nam_dict.txt jest udostępniany na licencji GNU Free Documentation License.
Changelog
0.3.0 (2016-07-02)
- Usuń opcję init unknown_value, ponieważ można ją bardzo łatwo zaimplementować za pomocą wrappera, jeśli jest potrzebna.
- Zwróć unknown, gdy nazwa nie zostanie znaleziona i andy, gdy jest ważna zarówno dla mężczyzny, jak i kobiety.
- Testuj przykłady z README jako doctesty.
- Popraw błędne wykrywanie płci w zależności od kraju dla nazw nie-iso886-15 pochodzących ze zmiany długości linii po konwersji pliku danych na UTF-8. Zobacz #gh2. Thanks @miquelcamprodon.
0.2.0 (2015-12-06)
- Wire in tox to test in both Python 2 and Python 3.
- Python 2 and 3 compatiblity.
- Usuniecie przestarzałego kodu mapera znaków.
Dla poprzednich wersji, zobacz sexmachine.
Credits
To jest fork pakietu SexMachine autorstwa Ferhata Elmasa. Został on stworzony, aby móc opublikować wersję kompatybilną z Pythonem 3 na PyPI i aby móc dodać kilka ulepszeń bez zawracania głowy oryginalnemu autorowi.
.
Leave a Reply