最新消息:雨落星辰是一个专注网站SEO优化、网站SEO诊断、搜索引擎研究、网络营销推广、网站策划运营及站长类的自媒体原创博客

解决Unix-like、Windows系统之间文本换行符不同的问题

运维笔记admin4浏览0评论

\r是回车符,\n是换行符,各个系统的换行标志:

win                      \r\n

linux/unix               \n

Mac   OS                 \r

CR用符号'\r'表示十进制ASCII代码是13, 十六进制代码为OxOD

LF使用'\n'符号表示, ASCII代码是10, 十六制为0x0A

所以:

Windows下用的是OAOD,即CR&LF

linux/unix用的是OA,即LF

MacOS用的是OD,即CR

 

来历:

    计算机还没有出现之前,有一种叫做电传打字机(Teletype Model 33)的玩意,每秒钟可以打10个字符。但是它有一个问题,就是打完一行换行的时候,要用去0.2秒,正好可以打两个字符。要是在这0.2秒里面,又有新的字符传过来,那么这个字符将丢失。

    于是,研制人员想了个办法解决这个问题,就是在每行后面加两个表示结束的字符。一个叫做“回车”,告诉打字机把打印头定位在左边界;另一个叫做“换行”,告诉打字机把纸向下移一行。这就是“换行”和“回车”的来历,从它们的英语名字上也可以看出一二。

    后来,计算机发明了,这两个概念也就被般到了计算机上。那时,存储器很贵,一些科学家认为在每行结尾加两个字符太浪费了,加一个就可以。于是,就出现了分歧。Unix 系统里,每行结尾只有“<换行>”,即“\n”;Windows系统里面,每行结尾是“<回车><换行>”,即“ \r\n”;Mac系统里,每行结尾是“<回车>”。一个直接后果是,Unix/Mac系统下的文件在Windows里打开的话,所有文字会变成一行;而Windows里的文件在Unix/Mac下打开的话,在每行的结尾可能会多出一个^M符号。

 

问题一:Windows下编写的纯文本文档在Linux下使用,例如Windows下编写的SH脚本,放到Linux下执行可能会出错。

 

解决方法:不用系统记事本,自己下载一个Ultraedit或者Nodepad++文本编辑器,Ultraedit下将该文件执行“File->conversions->Dos to Unix,执行这个转化后的sh文件能够直接在linux下执行。这步操作能够就是将\r\n转换成\n

 

方法二:

windowstxt文件保存为ANSI格式,然后在Linux终端输入:

cat ms.txt | col -b > linux.txt

 

方法三:我的另一个方法

***********************************************

利用cat -v test.txt可以显示test.txt中的\r(显示为^M),然后去掉^M即可。

输入:

cat -v test.txt >te.txt

然后cat te.txt可见行尾有^M,即\r。我们把^M去掉即可:

vi te.txt

vi中输入替换命令

:%s/\^M//g

再保存即可。

***********************************************

 

 

问题二:Linux下新建的文档在Windows下用记事本打开内容会挤在一起(没有了换行符)。原因是记事本不支持\n换行(它只支持\r\n形式的换行)。

 

解决方法:Windows中使用Ultraedit或者Nodepad++文本编辑器,执行转换。

 

另外,有两个偏方:

1Windows中把txt后缀改成doc或者c,用WordVC6.0来打开,然后复制到txt文件中。

2)在Linux下新建文本文档的时候,不要用Vim或者Gedit,用Open Office,保存成doc格式。

 

打开文本文件可以用:

1gedit xx.doc

2vim xx.docvim可能不支持繁体字,如果不涉及繁体字以及古怪的符号,就可以用vim

3)找到文件,直接用Open Office打开。选择字符集(系统),字符(SYSong18030,语言(中文简体),换段落:CR&LF(或者LF)。

 

注意:如果文件名是中文(比如vim 测试.txt),那有可能找不到,须要ls一下,然后复制文件名,然后再gedit 粘贴文件名。

 

1. CR&LF,即\r\n,这是Windows下记事本的格式,Linux是完全支持的;(推荐

2. CR,即\r,记事本不支持,没有换行效果,也没有\r效果;Word下有换行效果,也有\r

3. LF,即\nlinux/unix系统下的换行符。(shell脚本就需要这个格式

 

PS

    \r效果是:在每一行的末尾,默认的光标定位是下一行的行首,也就是说在行尾输入的内容实际上是下一行的行首,\r才是真正的换行,而\n是回车,原本指打字机的纸张往下移动一位,后来在Unix-like系统下,\n成为了实际上的换行符。\r\n的区别看下面的例子就知道了:

    \n\rC语言中的用法:

#include <stdio.h>

int main()

{

    printf("938517\r10086\n");

    return 0;

}

无论是Linux系统还是Windows平台,输入均是

10086

    因为\r已经换行了,所以938517就不再显示了。而\n并不是真正意义上的换行,它实际上是把纸张(或屏幕)向下移动一位(以便显示下一行的内容)。

 

 

问题三:Windows下编写的doc文档,在Linux下查看(用Open Office)一般都会乱码。

 

解决方法:先用Open Office打开,然后再全选,把字体设置为SYSong18030OK中文简体和繁体都显示正常了。

 

 

问题四:在不同平台间使用FTP软件传送文件时ascii文本模式传输模式下一些FTP客户端程序会自动对换行格式进行转换,经过这种传输的文件字节数可能会发生变化。

 

解决方法:如果你不想ftp修改原文件可以使用bin模式(二进制模式)传输文本


转载地址:http://blog.chinaunix/uid-25908383-id-3031018.html

发布评论

评论列表(0)

  1. 暂无评论
ok 不同模板 switch ($forum['model']) { /*case '0': include _include(APP_PATH . 'view/htm/read.htm'); break;*/ default: include _include(theme_load('read', $fid)); break; } } break; case '10': // 主题外链 / thread external link http_location(htmlspecialchars_decode(trim($thread['description']))); break; case '11': // 单页 / single page $attachlist = array(); $imagelist = array(); $thread['filelist'] = array(); $threadlist = NULL; $thread['files'] > 0 and list($attachlist, $imagelist, $thread['filelist']) = well_attach_find_by_tid($tid); $data = data_read_cache($tid); empty($data) and message(-1, lang('data_malformation')); $tidlist = $forum['threads'] ? page_find_by_fid($fid, $page, $pagesize) : NULL; if ($tidlist) { $tidarr = arrlist_values($tidlist, 'tid'); $threadlist = well_thread_find($tidarr, $pagesize); // 按之前tidlist排序 $threadlist = array2_sort_key($threadlist, $tidlist, 'tid'); } $allowpost = forum_access_user($fid, $gid, 'allowpost'); $allowupdate = forum_access_mod($fid, $gid, 'allowupdate'); $allowdelete = forum_access_mod($fid, $gid, 'allowdelete'); $access = array('allowpost' => $allowpost, 'allowupdate' => $allowupdate, 'allowdelete' => $allowdelete); $header['title'] = $thread['subject']; $header['mobile_link'] = $thread['url']; $header['keywords'] = $thread['keyword'] ? $thread['keyword'] : $thread['subject']; $header['description'] = $thread['description'] ? $thread['description'] : $thread['brief']; $_SESSION['fid'] = $fid; if ($ajax) { empty($conf['api_on']) and message(0, lang('closed')); $apilist['header'] = $header; $apilist['extra'] = $extra; $apilist['access'] = $access; $apilist['thread'] = well_thread_safe_info($thread); $apilist['thread_data'] = $data; $apilist['forum'] = $forum; $apilist['imagelist'] = $imagelist; $apilist['filelist'] = $thread['filelist']; $apilist['threadlist'] = $threadlist; message(0, $apilist); } else { include _include(theme_load('single_page', $fid)); } break; default: message(-1, lang('data_malformation')); break; } ?>