找回密码
 注册
搜索
热搜: 回贴
  • 前程无忧官网首页 有什么好的平台可以
  • 最新的销售平台 互联网营销的平台有哪
  • 制作网页的基本流程 网页制作和网页设
  • 【帝国CMS】输出带序号的列表(数字排
  • 网站建设公司 三一,中联,极东泵车的
  • 织梦 建站 织梦网站模版后台怎么更改
  • 云服务官网 哪些网站有免费的简历模板
  • 如何建网站要什么条件 建网站要用什么
  • 吉林市移动公司电话 吉林省退休人员网
  • 设计类毕业论文 网站设计与实现毕业论
查看: 661|回复: 5

文本操作问题

[复制链接]
发表于 2009-11-4 01:09:28 | 显示全部楼层 |阅读模式 IP:江苏扬州
大家看下面这段话存放在C:/aaa.txt中:
用C++如何统计下面两个(两个连在一块的字)联体字
(比如:就中,中国,国而,而言)
出现的频率


就中国而言,伊朗算不上什么大国家。
但是如果以石油优势来衡量的话,那么伊朗也算一个地地道道的大国。
然而中国的优势在于人才优势,印度在这方面可以逼近中国。
但是这不是现在,可能是在模糊不请的未来吧!
尽管我们国家的受教育人口明显高于印度。
但印度的优势在于他们的软件非我们所能及!
然而这些并非衡量一个国家的总体实力!

比如上面这段话: “就中”出现了1次;
“中国”出现了4次;
“国而” 出现了1次;
“而言”出现了1次;
“伊朗”出现了2次;
。。。。。。。。。。。。。。。。。。。
。。。。。。。。。。。。。。。。。。。
。。。。。。。。。。。。。。。。。。。
“优势”出现了4次;
。。。。。。。。。。。。。。。。。。。
。。。。。。。。。。。。。。。。。。。
把出现频率超过2次(不包括2次)的联体字写到C:/bbb.txt中
发表于 2009-11-4 01:09:29 | 显示全部楼层 IP:江苏扬州
联体?几个字?只能是2个字》?
回复

使用道具 举报

发表于 2009-11-4 01:09:29 | 显示全部楼层 IP:江苏扬州
对目前我只针对两个字操作(暂时还不奢望更多的想法),但是不会.
请大家指教!
回复

使用道具 举报

发表于 2009-11-4 01:09:31 | 显示全部楼层 IP:江苏扬州
我是这样想的:
用map<wchar_t*,int>.
用wchar_t*的作为key,存储词语。
用int存储出现的词语次数。
如果重复,就不用往map里添加数据了,直接改变相应的key对应的值就可以了。

不知道这样行不行
回复

使用道具 举报

发表于 2009-11-4 01:09:32 | 显示全部楼层 IP:江苏扬州
判断重复,可以用A::reference operator[](const Key& key);如果返回值>0,那么说明重复出现了。
回复

使用道具 举报

发表于 2009-11-4 01:09:33 | 显示全部楼层 IP:江苏扬州
因为这里面我的问题还是挺多的!
我希望谁能帮写一个!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|小黑屋|最新主题|手机版|微赢网络技术论坛 ( 苏ICP备08020429号 )

GMT+8, 2024-10-1 01:26 , Processed in 0.252811 second(s), 13 queries , Gzip On, MemCache On.

Powered by Discuz! X3.5

© 2001-2023 Discuz! Team.

快速回复 返回顶部 返回列表