gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Tento balíček používá základní data z programu „gender“ od Jorga Michaela (popsaného zde). Jeho použití je celkem jednoduché:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Výsledkem bude jedna z možností neznámý (jméno nenalezeno), andy (androgynní), muž, žena, převážně_muž nebo převážně_žena. Rozdíl mezi andy a unknown spočívá v tom, že u prvního z nich je zjištěna stejná pravděpodobnost, že jde o muže, jako že jde o ženu, zatímco pozdější znamená, že jméno nebylo v databázi nalezeno.

I18N je plně podporováno:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Doplňkově můžete upřednostnit konkrétní země:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Doplňkově můžete vytvořit detektor, který nebude rozlišovat velká a malá písmena (výchozí je rozlišovat velká a malá písmena):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Snažte se nevytvářet mnoho detektorů, protože každé vytvoření znamená čtení datového souboru.

Licence

Kód generátoru je šířen pod licencí GPLv3. Datový soubor nam_dict.txt je uvolněn pod GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Odstranění volby unknown_value init, protože v případě potřeby ji lze velmi snadno implementovat pomocí wrapperu.
  • Vrátit unknown, když jméno není nalezeno, a andy, když platí stejně pro muže i ženu.
  • Testovat příklady README jako doctesty.
  • Oprava nesprávné detekce pohlaví podle země pro jména, která nejsou viso886-15, pocházející ze změny délky řádku po převodu datového souboru na UTF-8. Viz #gh2. Díky @miquelcamprodon.

0.2.0 (2015-12-06)

  • Zapojení do tox pro testování v Pythonu 2 i Pythonu 3.
  • Kompatibilita s Pythonem 2 a 3. Děkuji.
  • Odstranění zastaralého kódu mapovače znaků.

Pro předchozí verze viz sexmachine.

Kredity

Toto je fork balíčku SexMachine od Ferhata Elmase. Byl vytvořen, aby bylo možné publikovat verzi kompatibilní s Pythonem 3 na PyPI a aby bylo možné přidat některá další vylepšení, aniž by se původní autor musel obtěžovat.

.

Leave a Reply