gender-guesser 0.4.0
Denne pakke bruger de underliggende data fra programmet “gender” af Jorg Michael (beskrevet her). Dens brug er ret ligetil:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
Resultatet vil være et af unknown (navn ikke fundet), andy (androgynous), male, female, mostly_male, eller mostly_female. Forskellen mellem andy og unknown er, at førstnævnte findes at have samme sandsynlighed for at være mand som for at være kvinde, mens sidstnævnte betyder, at navnet ikke blev fundet i databasen.
I18N understøttes fuldt ud:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Der kan desuden gives fortrinsret til bestemte lande:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Der kan desuden oprettes en detektor, der ikke er case sensitive (standard er at være case sensitive):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Søg at undgå at oprette mange detektorer, da hver oprettelse betyder læsning af datafilen.
Licenser
Generatorkoden distribueres under GPLv3. Datafilen nam_dict.txt er udgivet under GNU Free Documentation License.
Changelog
0.3.0 (2016-07-02)
- Fjernelse af unknown_value init option, da den kan implementeres meget nemt med en wrapper, hvis det er nødvendigt.
- Returnerer ukendt, når navnet ikke findes, og andy, når det er gyldigt lige gyldigt for både mand og kvinde.
- Test README-eksempler som doktests.
- Fiks forkert landvis kønsdetektion for ikke-iso886-15 navne, der kommer fra ændring af linjelængde efter datafilkonvertering til UTF-8. Se #gh2. Tak @miquelcamprodon.
0.2.0 (2015-12-06)
- Indkobl tox for at teste i både Python 2 og Python 3.
- Python 2- og 3-kompatibilitet.
- Fjern forældet kode til karaktermapper.
For tidligere versioner, se sexmachine.
Kreditter
Dette er en fork af SexMachine-pakken af Ferhat Elmas. Den blev oprettet for at kunne udgive en Python 3-kompatibel version til PyPI og for at kunne tilføje nogle flere forbedringer uden at genere den oprindelige forfatter.
Leave a Reply