gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Este pacote usa os dados subjacentes do programa “gênero” de Jorg Michael (descrito aqui). Seu uso é bastante simples:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

O resultado será um de desconhecido (nome não encontrado), andy (andrógino), macho, fêmea, principalmente_macho, ou principalmente_fêmea. A diferença entre andy e desconhecido é que o primeiro tem a mesma probabilidade de ser masculino que o feminino, enquanto que o último significa que o nome não foi encontrado na base de dados.

I18N é totalmente suportado:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Adicionalmente, você pode dar preferência a países específicos:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Adicionalmente, você pode criar um detector que não seja sensível a maiúsculas e minúsculas (o padrão é ser sensível a maiúsculas e minúsculas):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Tente evitar criar muitos Detectores, pois cada criação significa ler o arquivo de dados.

Licenças

O código do gerador é distribuído sob a GPLv3. O arquivo de dados nam_dict.txt é lançado sob a GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Remover opção de init desconhecido_valor, uma vez que pode ser implementado muito facilmente com um wrapper, se necessário.
  • Retornar desconhecido quando o nome não é encontrado e ey quando é válido igualmente para masculino e feminino.
  • Exemplos de teste README como doctes.
  • Fixar detecção incorreta de gênero por país para nomes não-iso886-15 provenientes de mudança de comprimento de linha após a conversão do arquivo de dados para UTF-8. Veja #gh2. Obrigado @miquelcamprodon.

0.2.0 (2015-12-06)

  • Fio em tox para testar a compatibilidade em Python 2 e Python 3.
  • Python 2 e 3.
  • Remover código cartográfico obsoleto.

Para versões anteriores, veja sexmachine.

Créditos

Este é um garfo do pacote SexMachine de Ferhat Elmas. Ele foi criado para poder publicar uma versão compatível com Python 3 para PyPI e para poder adicionar mais algumas melhorias sem colocar problemas ao autor original.

Leave a Reply