当前位置: 首页 > news >正文 内蒙古建设项目环保备案网站wordpress post属性 news 2025/11/3 0:39:52 内蒙古建设项目环保备案网站,wordpress post属性,pr软件,wap站目录 ❤ 前言 文本编辑器存取文件的原理#xff08;nodepad#xff0c;pycharm#xff0c;word#xff09; python解释器执行py文件的原理 #xff0c;例如python test.py 总结 ❤ 什么是字符编码? ASCII MBCS Unicode ❤ 字符编码的发展史 阶段一: 现代计算…目录 ❤ 前言 文本编辑器存取文件的原理nodepadpycharmword python解释器执行py文件的原理 例如python test.py 总结 ❤ 什么是字符编码? ASCII MBCS Unicode ❤ 字符编码的发展史 阶段一: 现代计算机起源于美国最早诞生也是基于英文考虑的ASCII 阶段二: 为了满足中文中国人定制了GBK 阶段三: 各国有各国的标准就会不可避免地出现冲突结果就是在多语言混合的文本中显示出来会有乱码。 ❤ 字符编码的分类 ❤ 内存为什么不用UTF-8呢 ❤ 字符编码之文本编辑器操作 总结 ❤ 乱码分析 乱码一存文件时就已经乱码 乱码二存文件时不乱码而读文件时乱码 ❤ 总结 python从小白到总裁完整教程目录:https://blog.csdn.net/weixin_67859959/article/details/129328397?spm1001.2014.3001.5502 ❤ 前言 文本编辑器存取文件的原理nodepadpycharmword 打开编辑器就打开了启动了一个进程是在内存中的所以在编辑器编写的内容也都是存放与内存中的断电后数据丢失因而需要保存到硬盘上点击保存按钮就从内存中把数据刷到了硬盘上。 在这一点上我们编写一个py文件没有执行跟编写其他文件没有任何区别都只是在编写一堆字符而已。 python解释器执行py文件的原理 例如python test.py 第一阶段python解释器启动此时就相当于启动了一个文本编辑器 第二阶段python解释器相当于文本编辑器去打开test.py文件从硬盘上将test.py的文件内容读入到内存中 第三阶段python解释器解释执行刚刚加载到内存中test.py的代码 总结: python解释器是解释执行文件内容的因而python解释器具备读py文件的功能这一点与文本编辑器一样与文本编辑器不一样的地方在于python解释器不仅可以读文件内容还可以执行文件内容❤ 什么是字符编码? 计算机要想工作必须通电,也就是说‘电’驱使计算机干活,而‘电’的特性就是高低电平(高低平即二进制数1,低电平即二进制数0),也就是说计算机只认识数字 编程的目的是让计算机干活而编程的结果说白了只是一堆字符也就是说我们编程最终要实现的是一堆字符驱动计算机干活 所以必须经过一个过程 字符--------翻译过程-------数字 这个过程实际就是一个字符如何对应一个特定数字的标准这个标准称之为字符编码 ASCII ASCII(American Standard Code for Information Interchange)是一种单字节的编码。计算机世界里一开始只有英文而单字节可以表示256个不同的字符可以表示所有的英文字符和许多的控制 符号。不过ASCII只用到了其中的一半\x80以下这也是MBCS得以实现的基础。 MBCS 然而计算机世界里很快就有了其他语言单字节的ASCII已无法满足需求。后来每个语言就制定了一套自己的编码由于单字节能表示的字符太少而且同时也需要与ASCII编码保持兼容所以这些编码纷纷使用了多字节来表示字符如GBxxx、BIGxxx等等他们的规则是如果第一个字节是\x80以下则仍然表示ASCII字符而如果是\x80以上则跟下一个字节一起共两个字节表示一个字符然后跳过下一个字节继续往下判断。 这里IBM发明了一个叫Code Page的概念将这些编码都收入囊中并分配页码GBK是第936页也就是CP936。所以也可以使用CP936表示GBK。 MBCS(Multi-Byte Character Set)是这些编码的统称。目前为止大家都是用了双字节所以有时候也叫做DBCS(Double-Byte Character Set)。必须明确的是MBCS并不是某一种特定的编码Windows里根据你设定的区域不同MBCS指代不同的编码而Linux里无法使用 MBCS作为编码。在Windows中你看不到MBCS这几个字符因为微软为了更加洋气使用了ANSI来吓唬人记事本的另存为对话框里编码ANSI就是MBCS。同时在简体中文Windows默认的区域设定里指代GBK。 Unicode 后来有人开始觉得太多编码导致世界变得过于复杂了让人脑袋疼于是大家坐在一起拍脑袋想出来一个方法所有语言的字符都用同一种字符集来表示这就是Unicode。 最初的Unicode标准UCS-2使用两个字节表示一个字符所以你常常可以听到Unicode使用两个字节表示一个字符的说法。但过了不久有人觉得256*256太少了还是不够用于是出现了UCS-4标准它使用4个字节表示一个字符不过我们用的最多的仍然是UCS-2。 UCS(Unicode Character Set)还仅仅是字符对应码位的一张表而已比如汉这个字的码位是6C49。字符具体如何传输和储存则是由UTF(UCS Transformation Format)来负责。 一开始这事很简单直接使用UCS的码位来保存这就是UTF-16比如汉直接使用\x6C\x49保存(UTF-16-BE)或是倒过来使用\x49\x6C保存(UTF-16-LE)。但用着用着美国人觉得自己吃了大亏以前英文字母只需要一个字节就能保存了现在大锅饭一吃变成了两个字节空间消耗大了一倍……于是UTF-8横空出世。 UTF-8是一种很别扭的编码具体表现在他是变长的并且兼容ASCIIASCII字符使用1字节表示。然而这里省了的必定是从别的地方抠出来 的你肯定也听说过UTF-8里中文字符使用3个字节来保存吧 另外值得一提的是BOM(Byte Order Mark)。我们在储存文件时文件使用的编码并没有保存打开时则需要我们记住原先保存时使用的编码并使用这个编码打开这样一来就产生了许多麻烦。 你可能想说记事本打开文件时并没有让选编码不妨先打开记事本再使用文件 - 打开看看而UTF则引入了BOM来表示自身编码如果一开始读入的几个字节是其中之一则代表接下来要读取的文字使用的编码是相应的编码 BOM_UTF8 \xef\xbb\xbf BOM_UTF16_LE \xff\xfe BOM_UTF16_BE \xfe\xff 并不是所有的编辑器都会写入BOM但即使没有BOMUnicode还是可以读取的只是像MBCS的编码一样需要另行指定具体的编码否则解码将会失败。 你可能听说过UTF-8不需要BOM这种说法是不对的只是绝大多数编辑器在没有BOM时都是以UTF-8作为默认编码读取。即使是保存时默认使 用ANSI(MBCS)的记事本在读取文件时也是先使用UTF-8测试编码如果可以成功解码则使用UTF-8解码。记事本这个别扭的做法造成了一个 BUG如果你新建文本文件并输入姹塧然后使用ANSI(MBCS)保存再打开就会变成汉a你不妨试试. ❤ 字符编码的发展史 计算机由美国人发明最早的字符编码为ASCII只规定了英文字母数字和一些特殊字符与数字的对应关系。最多只能用 8 位来表示一个字节即2**8 256所以ASCII码最多只能表示 256 个符号。 阶段一现代计算机起源于美国最早诞生也是基于英文考虑的ASCII ASCII:一个Bytes代表一个字符英文字符/键盘上的所有其他字符1Bytes8bit8bit可以表示0-2**8-1种变化即可以表示256个字符 ASCII最初只用了后七位127个数字已经完全能够代表键盘上所有的字符了英文字符/键盘的所有其他字符 后来为了将拉丁文也编码进了ASCII表将最高位也占用了 阶段二:为了满足中文中国人定制了GBK GBK:2Bytes代表一个字符 为了满足其他国家各个国家纷纷定制了自己的编码 日本把日文编到Shift_JIS里韩国把韩文编到Euc-kr里 阶段三各国有各国的标准就会不可避免地出现冲突结果就是在多语言混合的文本中显示出来会有乱码。 于是产生了unicode统一用2Bytes代表一个字符2**16-165535可代表6万多个字符因而兼容万国语言,但对于通篇都是英文的文本来说这种编码方式无疑是多了一倍的存储空间二进制最终都是以电或者磁的方式存储到存储介质中的 于是产生了UTF-8对英文字符只用1Bytes表示对中文字符用3Bytes 需要强调的一点是 unicode简单粗暴所有字符都是2Bytes优点是字符-数字的转换速度快缺点是占用空间大 utf-8精准对不同的字符用不同的长度表示优点是节省空间缺点是字符-数字的转换速度慢因为每次都需要计算出字符需要多长的Bytes才能够准确表示 内存中使用的编码是unicode用空间换时间程序都需要加载到内存才能运行因而内存应该是尽可能的保证快硬盘中或者网络传输用utf-8网络I/O延迟或磁盘I/O延迟要远大与utf-8的转换延迟而且I/O应该是尽可能地节省带宽保证数据传输的稳定性。❤ 字符编码的分类 计算机由美国人发明最早的字符编码为ASCII只规定了英文字母数字和一些特殊字符与数字的对应关系。 ascii用1个字节8位二进制代表一个字符 unicode常用2个字节16位二进制代表一个字符生僻字需要用4个字节 如果我们的文档通篇都是英文你用unicode会比ascii耗费多一倍的空间在存储和传输上十分的低效 本着节约的精神又出现了把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节常用的英文字母被编码成1个字节汉字通常是3个字节只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符用UTF-8编码就能节省空间 字符ASCIIUnicodeUTF-8A0100000100000000 0100000101000001中x01001110 0010110111100100 10111000 10101101 从上面的表格还可以发现UTF-8编码有一个额外的好处就是ASCII编码实际上可以被看成是UTF-8编码的一部分所以大量只支持ASCII编码的历史遗留软件可以在UTF-8编码下继续工作。 ❤ 内存为什么不用UTF-8呢 这样不就可以直接把代码从内存直接丢入硬盘了吗出现这个问题的原因是硬盘中还躺了其他国家的代码各个国家的代码的二进制还需要运行在计算机上使用因此内存中必须使用Unicode的编码因为Unicode能和硬盘中其他国家的二进制中的代码进行转换但是UTF-8只是简化了代码的存储它并不能与其他国家硬盘中的代码进行关系转换。总而言之只有Unicode编码才能运行其他国家硬盘中的代码而UTF-8的代码无法进行该操作。 内存中还使用Unicode编码是因为历史遗留问题造成的但是因为现在写代码使用的都是UTF-8代码所以以后内存中的代码都将变成UTF-8代码并且以前遗留的各个国家的代码都将被淘汰所以未来内存中使用的编码也将使用UTF-8编码替代Unicode编码。 ❤ 字符编码之文本编辑器操作 总结 无论是何种编辑器要防止文件出现乱码请一定注意存放一段代码的文件也仅仅只是一个普通文件而已此处指的是文件没有执行前我们打开文件时出现的乱码 核心法则就是文件以什么编码保存的就以什么编码方式打开 而文件编码保存时候使用的编码方式是右下角的编码方式而解码的时候是使用文档开头申明的编码方式两种编码不同的时候很容易出现乱码的情况。 ❤ 乱码分析 首先明确概念 文件从内存刷到硬盘的操作简称存文件文件从硬盘读到内存的操作简称读文件乱码的两种情况 乱码一存文件时就已经乱码 存文件时由于文件内有各个国家的文字我们单以shiftjis去存 本质上其他国家的文字由于在shiftjis中没有找到对应关系而导致存储失败。但当我们硬要存的时候编辑并不会报错难道你的编码错误编辑器这个软件就跟着崩溃了吗但毫无疑问不能存而硬存肯定是乱存了即存文件阶段就已经发生乱码而当我们用shiftjis打开文件时日文可以正常显示而中文则乱码了。 乱码二存文件时不乱码而读文件时乱码 存文件时用utf-8编码保证兼容万国不会乱码而读文件时选择了错误的解码方式比如gbk则在读阶段发生乱码读阶段发生乱码是可以解决的选对正确的解码方式就ok了。 ❤ 总结 保证不乱码的核心法则就是字符按照什么标准而编码的就要按照什么标准解码此处的标准指的就是字符编码。在内存中写的所有字符一视同仁都是Unicode编码比如我们打开编辑器输入一个“你”我们并不能说“你”就是一个汉字此时它仅仅只是一个符号该符号可能很多国家都在使用根据我们使用的输入法不同这个字的样式可能也不太一样。只有在我们往硬盘保存或者基于网络传输时才能确定”你“到底是一个汉字还是一个日本字这就是Unicode转换成其他编码格式的过程了。简而言之就是内存中固定使用的就是Uncidoe编码我们唯一能改变的就是存储到硬盘时使用的编码。Unicode-----encode编码--------gbkUnicode--------decode解码----------gbk 文章转载自: http://www.morning.wmdbn.cn.gov.cn.wmdbn.cn http://www.morning.mhmdx.cn.gov.cn.mhmdx.cn http://www.morning.wyzby.cn.gov.cn.wyzby.cn http://www.morning.gpxbc.cn.gov.cn.gpxbc.cn http://www.morning.cnwpb.cn.gov.cn.cnwpb.cn http://www.morning.sgrwd.cn.gov.cn.sgrwd.cn http://www.morning.fbylq.cn.gov.cn.fbylq.cn http://www.morning.sgrwd.cn.gov.cn.sgrwd.cn http://www.morning.fdrch.cn.gov.cn.fdrch.cn http://www.morning.sh-wj.com.cn.gov.cn.sh-wj.com.cn http://www.morning.znqmh.cn.gov.cn.znqmh.cn http://www.morning.mlfmj.cn.gov.cn.mlfmj.cn http://www.morning.dgwrz.cn.gov.cn.dgwrz.cn http://www.morning.rcfwr.cn.gov.cn.rcfwr.cn http://www.morning.mpwgs.cn.gov.cn.mpwgs.cn http://www.morning.trrhj.cn.gov.cn.trrhj.cn http://www.morning.chfxz.cn.gov.cn.chfxz.cn http://www.morning.kjsft.cn.gov.cn.kjsft.cn http://www.morning.jwlmm.cn.gov.cn.jwlmm.cn http://www.morning.qznkn.cn.gov.cn.qznkn.cn http://www.morning.rgksz.cn.gov.cn.rgksz.cn http://www.morning.sgrwd.cn.gov.cn.sgrwd.cn http://www.morning.rccbt.cn.gov.cn.rccbt.cn http://www.morning.zyslyq.cn.gov.cn.zyslyq.cn http://www.morning.rbnnq.cn.gov.cn.rbnnq.cn http://www.morning.lyhry.cn.gov.cn.lyhry.cn http://www.morning.ahlart.com.gov.cn.ahlart.com http://www.morning.hpggl.cn.gov.cn.hpggl.cn http://www.morning.mpsnb.cn.gov.cn.mpsnb.cn http://www.morning.fgkrh.cn.gov.cn.fgkrh.cn http://www.morning.wklhn.cn.gov.cn.wklhn.cn http://www.morning.lpskm.cn.gov.cn.lpskm.cn http://www.morning.gtylt.cn.gov.cn.gtylt.cn http://www.morning.kdnrp.cn.gov.cn.kdnrp.cn http://www.morning.jwsrp.cn.gov.cn.jwsrp.cn http://www.morning.cxlys.cn.gov.cn.cxlys.cn http://www.morning.ltbwq.cn.gov.cn.ltbwq.cn http://www.morning.wwsgl.com.gov.cn.wwsgl.com http://www.morning.nhzxd.cn.gov.cn.nhzxd.cn http://www.morning.nbgfz.cn.gov.cn.nbgfz.cn http://www.morning.lpmdy.cn.gov.cn.lpmdy.cn http://www.morning.bszmy.cn.gov.cn.bszmy.cn http://www.morning.cwwbm.cn.gov.cn.cwwbm.cn http://www.morning.wmqxt.cn.gov.cn.wmqxt.cn http://www.morning.mqpdl.cn.gov.cn.mqpdl.cn http://www.morning.rzrbw.cn.gov.cn.rzrbw.cn http://www.morning.zzbwjy.cn.gov.cn.zzbwjy.cn http://www.morning.qdrrh.cn.gov.cn.qdrrh.cn http://www.morning.hmktd.cn.gov.cn.hmktd.cn http://www.morning.mtjwp.cn.gov.cn.mtjwp.cn http://www.morning.ybyln.cn.gov.cn.ybyln.cn http://www.morning.zkjqj.cn.gov.cn.zkjqj.cn http://www.morning.dyxzn.cn.gov.cn.dyxzn.cn http://www.morning.nkmw.cn.gov.cn.nkmw.cn http://www.morning.fkmqg.cn.gov.cn.fkmqg.cn http://www.morning.thrtt.cn.gov.cn.thrtt.cn http://www.morning.muniubangcaishui.cn.gov.cn.muniubangcaishui.cn http://www.morning.lwrks.cn.gov.cn.lwrks.cn http://www.morning.wbxr.cn.gov.cn.wbxr.cn http://www.morning.fbylq.cn.gov.cn.fbylq.cn http://www.morning.ccphj.cn.gov.cn.ccphj.cn http://www.morning.yhpq.cn.gov.cn.yhpq.cn http://www.morning.mzkn.cn.gov.cn.mzkn.cn http://www.morning.hghhy.cn.gov.cn.hghhy.cn http://www.morning.hqwtm.cn.gov.cn.hqwtm.cn http://www.morning.lgmgn.cn.gov.cn.lgmgn.cn http://www.morning.lqlhw.cn.gov.cn.lqlhw.cn http://www.morning.rjcqb.cn.gov.cn.rjcqb.cn http://www.morning.dglszn.com.gov.cn.dglszn.com http://www.morning.jlxqx.cn.gov.cn.jlxqx.cn http://www.morning.inheatherskitchen.com.gov.cn.inheatherskitchen.com http://www.morning.kgnnc.cn.gov.cn.kgnnc.cn http://www.morning.xrmwc.cn.gov.cn.xrmwc.cn http://www.morning.fqmbt.cn.gov.cn.fqmbt.cn http://www.morning.wpydf.cn.gov.cn.wpydf.cn http://www.morning.xysdy.cn.gov.cn.xysdy.cn http://www.morning.dmsxd.cn.gov.cn.dmsxd.cn http://www.morning.srjbs.cn.gov.cn.srjbs.cn http://www.morning.fqlxg.cn.gov.cn.fqlxg.cn http://www.morning.rfxg.cn.gov.cn.rfxg.cn 查看全文 http://www.tj-hxxt.cn/news/272316.html 相关文章: 网站开发团队取什么名字好wordpress仪表盘密码 jsp做的网页是网站吗做设计那些网站可以卖设计图 建管家企业网站用自家宽带做网站服务器 寻找富阳网站建设深圳市点击未来科技网站建设 做网站的厂家凡科网站手机投票怎么做 横岗做网站网络管理系统是什么 电子商务网站推广的目的做网站的结论与心得 广西宏泰成建设集团网站做门户网站那个系统好 广告设计专业学校郑州百度seo排名公司 外贸网站建设ppt模板以太坊网站开发 鹰潭市建设局网站网站域名所有权证书 政协网站 两学一做专题研讨某企业网站网页设计模板 法律咨询网站开发展示型网站制作服务 郑州做网站那家做的好网站图片标签 公司发布网站需要备案网站设计在线培训机构 广西城乡建设部网站seo综合查询系统 西宁网站建设报价壹君博贴心wordpress带会员中心的主题 几大门户网站新昌网站开发 如何套用别人网站模板做项目的招聘网站 怎么做网站seowordpress 主题 博客 面试个人简历范文及网站建设淘宝导航里的链接网站怎么做 崇明手机网站建设南京营销型网站建设 做网站关键词优化的公司宁河做网站公司 hs网站推广合肥做公司网站一般多少钱 网站建设作业多少钱自动外链网址 做ptt网站百度地图 添加到网站 建网站的公司浩森宇特代理网络游戏平台 网站提交 入口创意设计是什么意思 莒县建设局门户网站wordpress文章幻灯片 渭南网站开发wordpress 分享本文