'\ x ??'を変更する方法Pythonでユニコードするには?

私は文字列を持っています:

\xe2\x80\x8e\xd7\x93\xd7\x9c\xd7\x99\xd7\xaa\xe2\x80\x8e

Pythonを使ってUnicodeに変換したい

それ、どうやったら出来るの?

0
Python 2またはPython 3? Python 3の場合は、実際には文字列か bytes オブジェクトですか?
追加された 著者 Tim Pietzcker,
python 2.7は私のバージョンです
追加された 著者 eran,

1 答え

それは UTF-8データです。 Pythonはあなたに文字列リテラルフォームを表示しています。

>>> print '\xe2\x80\x8e\xd7\x93\xd7\x9c\xd7\x99\xd7\xaa\xe2\x80\x8e'.decode('utf8')
‎דלית‎

上記の行はUTF-8データを .decode( 'utf8')で unicode オブジェクトにデコードし、それを出力します。 print ステートメントは、端末が使用するエンコーディングを検査し、 unicode`オブジェクトを再エンコードして、端末が正しく表示できるようにします。

あなたはPythonとUnicodeを読みたいかもしれません:

6
追加された
ありがとう。私はユニコードでそれをしたい場合は?
追加された 著者 eran,
コード例の .decode( 'utf8')呼び出しは、正確に行います。 Unicodeを出力します(Pythonの print ステートメントを使用して、それを自動的に端末エンコーディングに変換します)。
追加された 著者 Martijn Pieters,