搜索
查看: 2823|回复: 2

从文件中读取,无法分割出中文的句号和逗号。

[复制链接]

7

主题

25

帖子

157

积分

一级会员

Rank: 2

积分
157
QQ
发表于 2013-1-8 14:09:43 | 显示全部楼层 |阅读模式
本帖最后由 forextea 于 2013-1-8 14:10 编辑
  1. for line in io.lines("single.txt") {
  2.                 line  = string.replace(line,"(<,>|<。>|\,|\.)",'\\1\r\n')
  3.                 string.save("cut.txt", line+'\r\n',true)
  4.     }   
复制代码
原帖见http://bbs.aardio.com/forum.php? ... a=page%3D1#pid49447

single.zip

447 Bytes, 下载次数: 20

回复

使用道具 举报

3

主题

873

帖子

4699

积分

荣誉会员

Rank: 8Rank: 8

积分
4699
发表于 2013-1-8 16:29:20 | 显示全部楼层

看你的帖子一直没人回,我想我还是提醒你一下,整理下创建一个简单的工程。 让别人下载你的附件以后可以一键运行重现错误。

看你的帖子一直没人回,我想我还是提醒你一下,整理下创建一个简单的工程。
让别人下载你的附件以后可以一键运行重现错误。
回复

使用道具 举报

75

主题

849

帖子

5044

积分

六级会员

The only one

Rank: 9Rank: 9Rank: 9

积分
5044
发表于 2013-1-8 16:43:51 | 显示全部楼层

你的文件single.txt是UTF-8编码的,读出来的都是乱码,需要转码后才能正常操作![code] import fsys.codepage; va

你的文件single.txt是UTF-8编码的,读出来的都是乱码,需要转码后才能正常操作!

  1. import fsys.codepage;

  2. var str = fsys.codepage.load("c:\single.txt","UTF-8");
  3. var cutStr = string.replace(str,"(<,>|<。>|\,|\.)",'\\1\r\n');

  4. string.save("c:\cut.txt", cutStr)

复制代码
小时候,幸福是一件东西,拥有就是幸福; 长大了,幸福是一个目标,达到就是幸福; 成熟后,发现幸福原来是一种心态,领悟就是幸福.
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

手机版|未经许可严禁引用或转载本站文章|站长邮箱|aardio.com|aardio官方社区 ( 皖ICP备09012014号 )

GMT+8, 2019-9-19 07:48 , Processed in 0.062500 second(s), 26 queries .

Powered by Discuz! X3.4

© 2001-2017 Comsenz Inc.

快速回复 返回顶部 返回列表