Python ve UTF-8 Kullanımı

Python ile programlama yaparken karakter sorununa rastladıysanız sorununuzu çözecek olan şey karakter kodlamasını değiştirmektir. Bu hataya genelde Türkçe karakter kullanırken rastlamışızdır. Bunun için şu yöntemleri kullanabilirz:

Python betiğinin en başına şu satırı yazarak betiğin utf-8 olarak kodlanmasını sağlarız:

# -*- coding: utf-8 -*-

Dosyadan veri okuyacağımız zaman open yerine şunu kullanırız:

import codecs
codecs.open('dosya.txt','r','utf-8')

Ya da herhangi bir stringi utf-8 şeklinde kodlamak için şunu kullanırız:

s = 'normal string'
u = unicode(s,'utf-8')

Unicode şeklinde kodladığımız u değişkenini tekrar normal string haline getirmek için şunu kullanırız:

normal = u.encode()

Leave a Reply

Your email address will not be published. Required fields are marked *

*