设为首页收藏本站

新微赢技术网

 找回密码
 注册
搜索
热搜: 回贴
查看: 1404|回复: 9
打印 上一主题 下一主题

[求助]怎么样统计汉字?

[复制链接]
跳转到指定楼层
1#
发表于 2009-11-3 03:04:35 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
请问怎么样统计文件里的汉字字数?
2#
发表于 2009-11-3 03:04:36 | 只看该作者
中、英文在一起吗?
哪怎么统计呢?
顶一下吧。
回复 支持 反对

使用道具 举报

3#
发表于 2009-11-3 03:04:37 | 只看该作者
若全部都是中文....


char str[] = "我喜欢编程!";
chin_len = strlen(str)/2;


若中文、e文杂交...

char str[] = "我喜欢c编程!";
则字符数:

int num = 0;
for (int i = 0; str[i]; i++) {
if (str[i] & 0x80) {
i++;
}
num++;
}
回复 支持 反对

使用道具 举报

4#
发表于 2009-11-3 03:04:38 | 只看该作者
给你一个例子统计汉字字数
#include <fstream>
#include <iostream>
using namespace std;
int main()
{
ifstream infile("D:\\china.txt");
if(!infile)
{
cout<<"cann't open this file"<<endl;
exit(1);
}
char ch;
int i = 0;
while(infile.get(ch))//读取一个字符,即一个字节
i++;
cout<<i/2<<endl;//汉字是两个字节,所以除2
system("pause");
return 0;
}
回复 支持 反对

使用道具 举报

5#
发表于 2009-11-3 03:04:39 | 只看该作者
以下是引用stylev在2006-6-9 12:03:15的发言:
若全部都是中文....




若中文、e文杂交...


char str[] = "我喜欢c编程!";

则字符数:


int num = 0;

for (int i = 0; str[i]; i++) {

if (str[i] & 0x80) {//这个表达式解释一下

i++;

}

num++;

}
回复 支持 反对

使用道具 举报

6#
发表于 2009-11-3 03:04:40 | 只看该作者
我来帮stylev解释下,根据规定,汉字的内码第一字节都是在0x80以上,如:

GBK范围:
1st byte 2nd byte
0x81~0xfe 0x40~0x7e and 0x80~0xfe

BIG5范围:
1st byte 2nd byte
0x81~0xfe 0x40~0x7e and 0xa1~0xfe

str[i] & 0x80这个语句是判断第一个字节是否在0x80之上即0x81~0xfe之间,如果是则当前2字节是汉字,否则则不是汉字
回复 支持 反对

使用道具 举报

7#
发表于 2009-11-3 03:04:41 | 只看该作者
o
xie le
回复 支持 反对

使用道具 举报

8#
发表于 2009-11-3 03:04:42 | 只看该作者
标点符号呢?不考虑啊?
回复 支持 反对

使用道具 举报

9#
发表于 2009-11-3 03:04:43 | 只看该作者
标点符号呢?不考虑啊?

可以继续根据内码过滤
回复 支持 反对

使用道具 举报

10#
发表于 2009-11-3 03:04:44 | 只看该作者
知道,我是说大家的代码,没考虑符号算不算字数~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

申请友链|小黑屋|最新主题|手机版|新微赢技术网 ( 苏ICP备08020429号 )  

GMT+8, 2024-11-18 07:30 , Processed in 0.077012 second(s), 9 queries , Gzip On, Memcache On.

Powered by xuexi

© 2001-2013 HaiAn.Com.Cn Inc. 寰耽

快速回复 返回顶部 返回列表