gender-guesser 0.4.0
Questo pacchetto usa i dati sottostanti del programma “gender” di Jorg Michael (descritto qui). Il suo uso è abbastanza semplice:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
Il risultato sarà uno tra unknown (nome non trovato), andy (androgino), male, female, mostly_male, or mostly_female. La differenza tra andy e unknown è che il primo ha la stessa probabilità di essere maschio che femmina, mentre il secondo significa che il nome non è stato trovato nel database.
I18N è pienamente supportato:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Inoltre, puoi dare la preferenza a specifici paesi:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Inoltre, puoi creare un rilevatore che non sia sensibile alle maiuscole e alle minuscole (l’impostazione predefinita è di essere sensibile alle maiuscole):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Cerca di evitare di creare molti rilevatori, poiché ogni creazione significa leggere il file dati.
Licenze
Il codice del generatore è distribuito sotto GPLv3. Il file di dati nam_dict.txt è rilasciato sotto la GNU Free Documentation License.
Changelog
0.3.0 (2016-07-02)
- Rimuovi l’opzione unknown_value init, poiché può essere implementata molto facilmente con un wrapper se necessario.
- Restituire unknown quando il nome non viene trovato e andy quando è valido ugualmente sia per il maschio che per la femmina.
- Testare gli esempi README come doctest.
- Fissare il rilevamento errato del genere in base al paese per i nomi non-iso886-15 che deriva dal cambiamento della lunghezza della riga dopo la conversione del file dati in UTF-8. Vedere #gh2. Grazie @miquelcamprodon.
0.2.0 (2015-12-06)
- Wire in tox per testare sia in Python 2 che Python 3.
- Python 2 e 3 compatiblity.
- Rimuovere il codice obsoleto del mappatore di caratteri.
Per le versioni precedenti, vedere sexmachine.
Credits
Questo è un fork del pacchetto SexMachine di Ferhat Elmas. È stato creato per essere in grado di pubblicare una versione compatibile con Python 3 su PyPI e per poter aggiungere alcuni miglioramenti senza disturbare l’autore originale.
Leave a Reply