gender-guesser 0.4.0
Tento balíček používá základní data z programu „gender“ od Jorga Michaela (popsaného zde). Jeho použití je celkem jednoduché:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
Výsledkem bude jedna z možností neznámý (jméno nenalezeno), andy (androgynní), muž, žena, převážně_muž nebo převážně_žena. Rozdíl mezi andy a unknown spočívá v tom, že u prvního z nich je zjištěna stejná pravděpodobnost, že jde o muže, jako že jde o ženu, zatímco pozdější znamená, že jméno nebylo v databázi nalezeno.
I18N je plně podporováno:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Doplňkově můžete upřednostnit konkrétní země:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Doplňkově můžete vytvořit detektor, který nebude rozlišovat velká a malá písmena (výchozí je rozlišovat velká a malá písmena):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Snažte se nevytvářet mnoho detektorů, protože každé vytvoření znamená čtení datového souboru.
Licence
Kód generátoru je šířen pod licencí GPLv3. Datový soubor nam_dict.txt je uvolněn pod GNU Free Documentation License.
Changelog
0.3.0 (2016-07-02)
- Odstranění volby unknown_value init, protože v případě potřeby ji lze velmi snadno implementovat pomocí wrapperu.
- Vrátit unknown, když jméno není nalezeno, a andy, když platí stejně pro muže i ženu.
- Testovat příklady README jako doctesty.
- Oprava nesprávné detekce pohlaví podle země pro jména, která nejsou viso886-15, pocházející ze změny délky řádku po převodu datového souboru na UTF-8. Viz #gh2. Díky @miquelcamprodon.
0.2.0 (2015-12-06)
- Zapojení do tox pro testování v Pythonu 2 i Pythonu 3.
- Kompatibilita s Pythonem 2 a 3. Děkuji.
- Odstranění zastaralého kódu mapovače znaků.
Pro předchozí verze viz sexmachine.
Kredity
Toto je fork balíčku SexMachine od Ferhata Elmase. Byl vytvořen, aby bylo možné publikovat verzi kompatibilní s Pythonem 3 na PyPI a aby bylo možné přidat některá další vylepšení, aniž by se původní autor musel obtěžovat.
.
Leave a Reply