gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Questo pacchetto usa i dati sottostanti del programma “gender” di Jorg Michael (descritto qui). Il suo uso è abbastanza semplice:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Il risultato sarà uno tra unknown (nome non trovato), andy (androgino), male, female, mostly_male, or mostly_female. La differenza tra andy e unknown è che il primo ha la stessa probabilità di essere maschio che femmina, mentre il secondo significa che il nome non è stato trovato nel database.

I18N è pienamente supportato:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Inoltre, puoi dare la preferenza a specifici paesi:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Inoltre, puoi creare un rilevatore che non sia sensibile alle maiuscole e alle minuscole (l’impostazione predefinita è di essere sensibile alle maiuscole):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Cerca di evitare di creare molti rilevatori, poiché ogni creazione significa leggere il file dati.

Licenze

Il codice del generatore è distribuito sotto GPLv3. Il file di dati nam_dict.txt è rilasciato sotto la GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Rimuovi l’opzione unknown_value init, poiché può essere implementata molto facilmente con un wrapper se necessario.
  • Restituire unknown quando il nome non viene trovato e andy quando è valido ugualmente sia per il maschio che per la femmina.
  • Testare gli esempi README come doctest.
  • Fissare il rilevamento errato del genere in base al paese per i nomi non-iso886-15 che deriva dal cambiamento della lunghezza della riga dopo la conversione del file dati in UTF-8. Vedere #gh2. Grazie @miquelcamprodon.

0.2.0 (2015-12-06)

  • Wire in tox per testare sia in Python 2 che Python 3.
  • Python 2 e 3 compatiblity.
  • Rimuovere il codice obsoleto del mappatore di caratteri.

Per le versioni precedenti, vedere sexmachine.

Credits

Questo è un fork del pacchetto SexMachine di Ferhat Elmas. È stato creato per essere in grado di pubblicare una versione compatibile con Python 3 su PyPI e per poter aggiungere alcuni miglioramenti senza disturbare l’autore originale.

Leave a Reply