当前位置: 首页>編程日記>正文

01.深入理解乱码的原理

01.深入理解乱码的原理

1. 前言

专栏介绍
本篇文章是此专栏的第一篇文章,在这之前,请允许我介绍一下本专栏:
你是否在学习过程中遇见了不认识的名词一脸懵逼?
你是否因为计算机的基础知识不合格陷入了学不会的死循环?
你是否在老师讲课的时候被抛出来的一系列名词不知所措?
本专栏就是为了解决这方面的问题
本专栏一周保持一篇左右的更新
喜欢的点点关注 非常感谢

2.什么是乱码

  • 这里不放任何的定义和理论,只用最简单的话来讲
  • 乱码就是你所遇到的"锟斤拷烫烫烫"和一些很奇怪的字符,它们就是乱码

3.逆向分析

我们在因特网上随便复制一段乱码,将它保存为UTF-8格式,使用VS编辑器打开.

3.1 开始分析

在这里插入图片描述

  • 现在展现给我们的是一段乱码,我们开始对这段乱码进行逆向分析
  • 我们要找到这些特殊字符是什么

3.2 二进制分析

  • 要想知道一段乱码的默认格式是什么,我们先从二进制开始分析
  • 使用Visual Studio二进制方式进行打开
  • 如图,出现的都是二进制数字,以十六进制进行展示.
    在这里插入图片描述
  • 我们可以看到很多CD 和CC开头的数据
  • 结合UTF-8编码知识
    在这里插入图片描述
  • 由此我们可以推断出,CC和CD并不是代表1字符,而是和后面的A4一起,两个字节代表出的一个字符

3.3 验证

  • 为了验证我们上面的猜想,我们把别的数据全部删除,把CD和A4多重复几次.
    在这里插入图片描述
  • 保存一下,以文本方式打开
    在这里插入图片描述
  • 现在就变成了一个字符了,因此,我们的猜想正确
  • 复制到网页里,就能查看到效果了
  • 数一下字符上面的符号,正好和我们CD A4的数量一致
    在这里插入图片描述
  • 因此 我们可以说 我们目前为止的推断完全正确

3.4 这个字符是什么

  • 我们可以从此出发,推断出 : 就是这个字符导致了奇怪的形式
  • 因此,我们去查看一下这个字符在Unicode的编号
  • CD A4只是UTF-8的编号,而不并不是Unicode的编号
  • 根据UTF-8的编码规则,逆向推论,得到编码 : 0364
  • 去搜索0364的unicode,得到结果 : 拉丁的小字母 e
    在这里插入图片描述
  • 因此,我们得到了结果 : 这个乱码是Unicode中的拉丁小字母e


https://www.fengoutiyan.com/post/14443.html

相关文章:

  • 为什么会产生乱码
  • 出现乱码的原因
  • 乱码是什么意思
  • 乱码问题
  • 深入理解MVC
  • 深入理解MVC原理
  • 解决中文乱码
  • 需要的代码是
  • 鏡像模式如何設置在哪,圖片鏡像操作
  • 什么軟件可以把圖片鏡像翻轉,C#圖片處理 解決左右鏡像相反(旋轉圖片)
  • 手機照片鏡像翻轉,C#圖像鏡像
  • 視頻鏡像翻轉軟件,python圖片鏡像翻轉_python中鏡像實現方法
  • 什么軟件可以把圖片鏡像翻轉,利用PS實現圖片的鏡像處理
  • 照片鏡像翻轉app,java實現圖片鏡像翻轉
  • 什么軟件可以把圖片鏡像翻轉,python圖片鏡像翻轉_python圖像處理之鏡像實現方法
  • matlab下載,matlab如何鏡像處理圖片,matlab實現圖像鏡像
  • 圖片鏡像翻轉,MATLAB:鏡像圖片
  • 鏡像翻轉圖片的軟件,圖像處理:實現圖片鏡像(基于python)
  • canvas可畫,JavaScript - canvas - 鏡像圖片
  • 圖片鏡像翻轉,UGUI優化:使用鏡像圖片
  • Codeforces,CodeForces 1253C
  • MySQL下載安裝,Mysql ERROR: 1253 解決方法
  • 勝利大逃亡英雄逃亡方案,HDU - 1253 勝利大逃亡 BFS
  • 大一c語言期末考試試題及答案匯總,電大計算機C語言1253,1253《C語言程序設計》電大期末精彩試題及其問題詳解
  • lu求解線性方程組,P1253 [yLOI2018] 扶蘇的問題 (線段樹)
  • c語言程序設計基礎題庫,1253號C語言程序設計試題,2016年1月試卷號1253C語言程序設計A.pdf
  • 信奧賽一本通官網,【信奧賽一本通】1253:抓住那頭牛(詳細代碼)
  • c語言程序設計1253,1253c語言程序設計a(2010年1月)
  • 勝利大逃亡英雄逃亡方案,BFS——1253 勝利大逃亡
  • 直流電壓測量模塊,IM1253B交直流電能計量模塊(艾銳達光電)
  • c語言程序設計第三版課后答案,【渝粵題庫】國家開放大學2021春1253C語言程序設計答案
  • 18轉換為二進制,1253. 將數字轉換為16進制
  • light-emitting diode,LightOJ-1253 Misere Nim
  • masterroyale魔改版,1253 Dungeon Master
  • codeformer官網中文版,codeforces.1253 B
  • c語言程序設計考研真題及答案,2020C語言程序設計1253,1253計算機科學與技術專業C語言程序設計A科目2020年09月國家開 放大學(中央廣播電視大學)
  • c語言程序設計基礎題庫,1253本科2016c語言程序設計試題,1253電大《C語言程序設計A》試題和答案200901
  • 肇事逃逸車輛無法聯系到車主怎么辦,1253尋找肇事司機