gender-guesser 0.4.0
Este pacote usa os dados subjacentes do programa “gênero” de Jorg Michael (descrito aqui). Seu uso é bastante simples:
>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy
O resultado será um de desconhecido (nome não encontrado), andy (andrógino), macho, fêmea, principalmente_macho, ou principalmente_fêmea. A diferença entre andy e desconhecido é que o primeiro tem a mesma probabilidade de ser masculino que o feminino, enquanto que o último significa que o nome não foi encontrado na base de dados.
I18N é totalmente suportado:
>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female
Adicionalmente, você pode dar preferência a países específicos:
>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male
Adicionalmente, você pode criar um detector que não seja sensível a maiúsculas e minúsculas (o padrão é ser sensível a maiúsculas e minúsculas):
>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female
Tente evitar criar muitos Detectores, pois cada criação significa ler o arquivo de dados.
Licenças
O código do gerador é distribuído sob a GPLv3. O arquivo de dados nam_dict.txt é lançado sob a GNU Free Documentation License.
Changelog
0.3.0 (2016-07-02)
- Remover opção de init desconhecido_valor, uma vez que pode ser implementado muito facilmente com um wrapper, se necessário.
- Retornar desconhecido quando o nome não é encontrado e ey quando é válido igualmente para masculino e feminino.
- Exemplos de teste README como doctes.
- Fixar detecção incorreta de gênero por país para nomes não-iso886-15 provenientes de mudança de comprimento de linha após a conversão do arquivo de dados para UTF-8. Veja #gh2. Obrigado @miquelcamprodon.
0.2.0 (2015-12-06)
- Fio em tox para testar a compatibilidade em Python 2 e Python 3.
- Python 2 e 3.
- Remover código cartográfico obsoleto.
Para versões anteriores, veja sexmachine.
Créditos
Este é um garfo do pacote SexMachine de Ferhat Elmas. Ele foi criado para poder publicar uma versão compatível com Python 3 para PyPI e para poder adicionar mais algumas melhorias sem colocar problemas ao autor original.
Leave a Reply