gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

Dit pakket gebruikt de onderliggende gegevens van het programma “gender” van Jorg Michael (hier beschreven). Het gebruik ervan is vrij eenvoudig:

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

Het resultaat is onbekend (naam niet gevonden), andy (androgyn), mannelijk, vrouwelijk, overwegend_mannelijk, of overwegend_vrouwelijk. Het verschil tussen andy en unknown is dat de eerste evenveel kans heeft om mannelijk als vrouwelijk te zijn, terwijl de laatste betekent dat de naam niet in de database is gevonden.

I18N wordt volledig ondersteund:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

Extra kunt u de voorkeur geven aan specifieke landen:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

Extra kunt u een detector maken die niet hoofdlettergevoelig is (de standaardinstelling is hoofdlettergevoelig):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

Probeer te voorkomen dat u veel detectors maakt, want elke keer dat u ze maakt, moet u het gegevensbestand lezen.

Licenties

De generator code wordt verspreid onder de GPLv3. Het gegevensbestand nam_dict.txt is vrijgegeven onder de GNU Free Documentation License.

Changelog

0.3.0 (2016-07-02)

  • Verwijder unknown_value init optie, omdat het heel gemakkelijk kan worden geïmplementeerd met een wrapper indien nodig.
  • Geef onbekende terug als de naam niet wordt gevonden en andy als het geldig is gelijk voor zowel man als vrouw.
  • Test README voorbeelden als doctests.
  • Fix onjuiste land-geslacht detectie voor niet-iso886-15 namen afkomstig van regel lengte verandering na data-bestand conversie naar UTF-8. Zie #gh2. Bedankt @miquelcamprodon.

0.2.0 (2015-12-06)

  • Wire in tox om te testen in zowel Python 2 en Python 3.
  • Python 2 en 3 compatibliteit.
  • Verouderde character mapper code verwijderen.

Voor vorige versies, zie sexmachine.

Credits

Dit is een vork van het SexMachine pakket door Ferhat Elmas. Het is gemaakt om een Python 3 compatibele versie te kunnen publiceren op PyPI en om wat meer verbeteringen te kunnen toevoegen zonder de originele auteur te storen.

Leave a Reply