Python如何读取16进制byte数据-偶像资源网

如何读取16进制byte数据

小弟最近在做网络编程的时候，遇到了一些byte数据需要储存，但是不是常见的str字符对应的byte，类似于b'\\x00\\xff\\xfe\\x01'这样的数据，查找资料后发现这种东西是16进制编码的byte格式，可以直接转成str没有问题，但是再转回bytes就会出现莫名其妙的双斜杠，很是头疼。

a = b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x19\\x39\\xd9\\x9d\\xfdABCDabcd\'
b = str(a)
 
print(b)
>>> b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x199\\xd9\\x9d\\xfdABCDabcd\'
 
print(bytes(b,\'utf8\'))
>>> b\"b\'\\\\x00\\\\xef\\\\xa2\\\\xa0\\\\xb3\\\\x8b\\\\x9d\\\\x1e\\\\xf8\\\\x98\\\\x199\\\\xd9\\\\x9d\\\\xfdABCDabcd\'\"

尝试写入文件，再读取也是如此，因为写进去的形式就是str字符

# 写入data.txt
a = b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x19\\x39\\xd9\\x9d\\xfdABCDabcd\'
with open(\'data.txt\',\'w\') as p:
    p.write(str(a))
 
# 读取data.txt
with open(\'data.txt\',\'r\') as p:
    line = p.readline()
 
print(line, type(line) == str)
>>> b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x199\\xd9\\x9d\\xfdABCDabcd\\\\\' True
 
print(bytes(line,\'utf8\'))
>>> b\"b\'\\\\x00\\\\xef\\\\xa2\\\\xa0\\\\xb3\\\\x8b\\\\x9d\\\\x1e\\\\xf8\\\\x98\\\\x199\\\\xd9\\\\x9d\\\\xfdABCDabcd\\\\\\\\\'\"

观察了一下ASCII码，发现主要还是因为\\x字符被理解成了一个斜杠加x的形式，然后被储存为str形式，相当于变成了两个字节。

这样解码的时候分开解了，但是\\xnn这种形式是应该看作ASCII码的，于是我写了个转义的逻辑进行读取：

def readbytetxt(filename):
    dic = {
    \'0\': 0,    \'1\': 1,    \'2\': 2,
    \'3\': 3,    \'4\': 4,    \'5\': 5,
    \'6\': 6,    \'7\': 7,    \'8\': 8,
    \'9\': 9,    \'a\': 10,   \'b\': 11,
    \'c\': 12,   \'d\': 13,   \'e\': 14,
    \'f\': 15,
    }
    with open(filename,\'r\') as p:
        line = p.readline()
        while line:
            if line[-1] == \'\\n\':
                line = line[:-1]
            i = 2
            L = b\'\'
            while i+1 < len(line):
                if line[i:i+2] == \'\\\\x\' and (line[i+2] in dic.keys()) and (line[i+3] in dic.keys()):
                    L += bytes([dic[line[i+2]]*16+dic[line[i+3]]])
                    i += 4
                else:
                    L += bytes(line[i],\'utf8\')
                    i += 1
            return L
            line = p.readline()
 
print(readbytetxt(\'data.txt\'))
>>> b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x19\\x39\\xd9\\x9d\\xfdABCDabcd\'

问题解决了！基本就是写了个遍历，然后遇到\\x就把16进制转成十进制的int，然后解码成bytes，这样常见的十六进制格式基本都能调用了。

后来发现除了\\x还有其他的转义字符，比如\\\\，\\n，如果不添加转变逻辑的话，依然会出现不识别的问题，于是重写了一下函数，支持了常见的大部分转义字符，并且写成了生成器输出。

def readbytetxt2(filename):
    dic = {
    \'0\': 0,    \'1\': 1,    \'2\': 2,
    \'3\': 3,    \'4\': 4,    \'5\': 5,
    \'6\': 6,    \'7\': 7,    \'8\': 8,
    \'9\': 9,    \'a\': 10,   \'b\': 11,
    \'c\': 12,   \'d\': 13,   \'e\': 14,
    \'f\': 15,
    }
    dic2 = {
    \'a\': \'\\a\',     \'b\': \'\\b\', 
    \'f\': \'\\f\',     \'n\': \'\\n\', 
    \'r\': \'\\r\',     \'v\': \'\\v\', 
    \'\\\'\': \'\'\',    \'\\\"\': \'\', 
    \'\\\\\': \'\\\\\', 
    }
    with open(filename,\'r\') as p:
        line = p.readline()
        while line:
            if line[-1] == \'\\n\':
                line = line[:-1]
            i = 2
            L = b\'\'
            while i+1 < len(line):
                if line[i:i+2] == \'\\\\x\' and (line[i+2] in dic.keys()) and (line[i+3] in dic.keys()):
                    L += bytes([dic[line[i+2]]*16+dic[line[i+3]]])
                    i += 4
                elif line[i] == \'\\\\\' and line[i+1] in dic2.keys():
                    L += bytes(dic2[line[i+1]],\'utf8\')
                    i += 2
                elif line[i:i+4] == \'\\\\000\':
                    L += bytes(\'\\000\',\'utf8\')
                    i += 2
                else:
                    L += bytes(line[i],\'utf8\')
                    i += 1
            yield L
            line = p.readline()
 
a = b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x19\\x39\\xd9\\x9d\\xfdthe first line\\n\\r\\a\\b\\t\\\\\\f\\\'\"vbn000\'
b = b\'xa0xdfxa2xa0xb3x8bx9dx1exf8x98x19x39xd9x9dxfdthe second linenn\'
c = b\'xe0xafxa2xa0xb3x8bx9dx1exf8x98x19x39xd9x9dxfdthe third line\\\'
with open(\'data.txt\',\'w\') as p:
    p.write(str(a)+\'n\')
    p.write(str(b)+\'n\')
    p.write(str(c))
 
line = readbytetxt2(\'data.txt\')
 
print([a for a in line])
>>> [b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x199\\xd9\\x9d\\xfdthe first line\\n\\r\\x07\\x08\\\\t\\\\\\x0c\\\'\"\\x0b\\x08\\n\\x00\', b\'\\xa0\\xdf\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x199\\xd9\\x9d\\xfdthe second line\\nn\', b\'\\xe0\\xaf\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x199\\xd9\\x9d\\xfdthe third line\\\\\']

基本上至此为止，大部分编码形式都可以搞定了。

但是。。。其实还有一个更简单的方式！因为其实万恶之源就是str字符格式里面有很多转义的地方不清不楚的，我想要的是byte存进文件，再以byte读出来，而byte格式本来就是16进制的数字，说到底其实只要能存数字就可以了！所以写了个更简单的方法，直接转成数字存数字列表就好！

L = []
a = b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x19\\x39\\xd9\\x9d\\xfdthe first line\\n\\r\\a\\b\\t\\\\\\f\\\'\\\"\\v\\b\\n\\000\'
print(a)
for each in a:
    L.append(int(each))
with open(\'data.txt\',\'w\') as p:
    p.write(str(L))
print(L)
>>> [0, 239, 162, 160, 179, 139, 157, 30, 248, 152, 25, 57, 217, 157, 253, 116, 104, 101, 32, 102, 105, 114, 115, 116, 32, 108, 105, 110, 101, 10, 13, 7, 8, 9, 92, 12, 39, 34, 11, 8, 10, 0]
 
 
with open(\'data.txt\',\'r\') as p:
    line = p.readline()
print(b\'\'.join([bytes([int(i)]) for i in line[1:-1].split(\',\')]))
>>> b\'\\x00\\xef\\xa2\\xa0\\xb3\\x8b\\x9d\\x1e\\xf8\\x98\\x199\\xd9\\x9d\\xfdthe first line\\n\\r\\x07\\x08\\t\\\\\\x0c\\\'\"x0bx08nx00\'

存进去的是数字列表，然后用split的方式读出来就可以了，这样也不会有各种转义搞不清的地方，数字是什么就读什么byte出来就可以了。

Python的十六进制数

转换关系

十进制整数转十六进制整数用hex()；十六进制整数转十进制整数用int()

类似地，十进制整数转二进制整数用bin()；十进制整数转八进制整数用oct()

hex() 函数

描述：hex() 函数用于将10进制整数转换成16进制，以字符串形式表示。

语法：

hex(x)

参数说明：x – 10进制整数

返回值：返回16进制数，以字符串形式表示。

int() 函数

描述：int() 函数用于将一个字符串或数字转换为整型。

语法：

class int(x, base=10)

参数说明：x – 字符串或数字。base – 进制数，默认十进制。

返回值：返回整型数据。

运算

对于十六进制整数，在进行运算前先转换成十进制整数，再对其进行运算，之后将运算结果转换回十六进制数。

以上为个人经验，希望能给大家一个参考，也希望大家多多支持。

版权声明 1 本网站名称：偶像资源网
2 本站永久网址：https://www.ox520.com
3 本网站的文章部分内容可能来源于网络，仅供大家学习与参考，如有侵权，请联系站长 QQ593098775进行删除处理。
4 本站一切资源不代表本站立场，并不代表本站赞同其观点和对其真实性负责。
5 本站一律禁止以任何方式发布或转载任何违法的相关信息，访客发现请向站长举报
6 本站资源大多存储在云盘，如发现链接失效，请联系我们我们会第一时间更新。

THE END

Python如何读取16进制byte数据

目录

如何读取16进制byte数据

Python的十六进制数

转换关系

hex() 函数

int() 函数

运算

请登录后发表评论