gender-guesser 0.4.0

https://travis-ci.org/lead-ratings/gender-guesser.svg?branch=master

このパッケージは Jorg Michael によるプログラム “gender” の基礎データ (ここに記述) を利用します。

>>> import gender_guesser.detector as gender>>> d = gender.Detector()>>> print(d.get_gender(u"Bob"))male>>> print(d.get_gender(u"Sally"))female>>> print(d.get_gender(u"Pauley")) # should be androgynousandy

結果は unknown (name not found), andy (androgynous), male, female, mostly_male, or mostly_female のいずれかになります。 andyとunknownの違いは、前者は男性である確率が女性である確率と同じであることがわかり、後者はデータベースで名前が見つからなかったことを意味します。

I18N を完全にサポート:

>>> print(d.get_gender(u"\xc1lfr\xfan")) # u"Álfrún"female

さらに、特定の国を優先することができます:

>>> print(d.get_gender(u"Jamie"))mostly_female>>> print(d.get_gender(u"Jamie", u'great_britain'))mostly_male

さらに、大文字小文字を区別しない検出器を作成できます(デフォルトは区別する):

>>> d = gender.Detector(case_sensitive=False)>>> print(d.get_gender(u"sally"))female>>> print(d.get_gender(u"Sally"))female

検出器の作成は、そのたびにデータ ファイルの読み込みを意味するので、多数の検出器の作成を回避するように努めてください。

Licenses

ジェネレータコードは GPLv3 で配布されます。 データファイル nam_dict.txt は GNU Free Documentation License で公開されています。

Changelog

0.3.0 (2016-07-02)

  • unknown_value init オプションを削除、必要ならラッパーで非常に簡単に実装可能なので、削除しました。
  • 名前が見つからない場合はunknownを、男性でも女性でも同じように有効な場合はandyを返します。
  • READMEの例をdoctestsとしてテストします。
  • データファイルをUTF-8に変換後に行長が変化することから、非iso886-15の名前に対する誤った国別の性別検出を修正しました。 gh2 を参照してください。 ありがとうございます @miquelcamprodon.

0.2.0 (2015-12-06)

  • Python 2 と Python 3 の両方でテストできるように tox で配線しました。
  • Remove obsolete character mapper code.

For previous versions, see sexmachine.

Credits

this is a fork of the SexMachine package by Ferhat Elmas. Python 3 互換バージョンを PyPI に公開し、原作者を悩ませることなくさらに改良を加えることができるようにするために作成されました。

Leave a Reply