gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Pakiet ten wykorzystuje podstawowe dane z programu „gender” autorstwa Jorga Michaela (opisanego tutaj). Jego użycie jest całkiem proste:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Wynikiem będzie jedna z wartości unknown (nie znaleziono nazwy), andy (androgyniczny), male, female, mostly_male, lub mostly_female. Różnica między andy a unknown jest taka, że w przypadku tego pierwszego prawdopodobieństwo bycia mężczyzną jest takie samo jak bycia kobietą, podczas gdy to drugie oznacza, że imię nie zostało znalezione w bazie danych.

I18N jest w pełni obsługiwany:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Dodatkowo możesz dać preferencje określonym krajom:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Dodatkowo możesz utworzyć detektor, w którym nie jest rozróżniana wielkość liter (domyślnie rozróżniana jest wielkość liter):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Staraj się unikać tworzenia wielu detektorów, ponieważ każde utworzenie oznacza odczytanie pliku danych.

Licencje

Kod generatora jest rozpowszechniany na licencji GPLv3. Plik danych nam_dict.txt jest udostępniany na licencji GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Usuń opcję init unknown_value, ponieważ można ją bardzo łatwo zaimplementować za pomocą wrappera, jeśli jest potrzebna.
  • Zwróć unknown, gdy nazwa nie zostanie znaleziona i andy, gdy jest ważna zarówno dla mężczyzny, jak i kobiety.
  • Testuj przykłady z README jako doctesty.
  • Popraw błędne wykrywanie płci w zależności od kraju dla nazw nie-iso886-15 pochodzących ze zmiany długości linii po konwersji pliku danych na UTF-8. Zobacz #gh2. Thanks @miquelcamprodon.

0.2.0 (2015-12-06)

  • Wire in tox to test in both Python 2 and Python 3.
  • Python 2 and 3 compatiblity.
  • Usuniecie przestarzałego kodu mapera znaków.

Dla poprzednich wersji, zobacz sexmachine.

Credits

To jest fork pakietu SexMachine autorstwa Ferhata Elmasa. Został on stworzony, aby móc opublikować wersję kompatybilną z Pythonem 3 na PyPI i aby móc dodać kilka ulepszeń bez zawracania głowy oryginalnemu autorowi.

.

Leave a Reply