微 信 题 库 搜 索
中医理论
中医数据库
中国方剂数据库 中医书籍 常见疾病
中医疾病数据库 民间中医 中医教程
中医疾病诊疗 经方医学 中医药术语数据库
 医学全在线 > 中医理论 > 民间中医 > 正文
中医资料:有关pdf资料的ocr,建议成立一个制作小组,大家请进
来源:本站原创 中医理论数据 字体:
资料库里的很大部分是pdf格式的,不便于摘抄,复制,更不方便传播。
前些时间在做易经类书籍的电子版,感觉集体合作的力量大的很,几十万字的书几天就制作好了。

http://www。37tcm。net/forum/viewthread.php?tid=4564&fpage=1
http://www。37tcm。net/forum/viewthread.php?tid=4038
http://www。37tcm。net/forum/viewthread.php?tid=4532

上面几个链接里wesleybb、古月等朋友已经在做桂林古本伤寒论的工作

有时间的朋友,我们可以成立一个制作小组。把pdf文档做成文本文档。
这样便于传播,比如一张cdrom就足以容纳所有有价值的内容
请大家发表自己的看法
没有意义,象支持、我顶、不错之类的回帖就免了。

[ Last edited by 鱼翔浅底 on 2005/12/10 at 11:20 ]
-----------可以的。你能告诉我制作的方法吗?
我几千本图书正在等待制作后给大家分享啊。
-----------pdf直接ocr没做过,我都是自己把书扫描成tif,刚才搜索到一些信息,贴出来供参考

软件名称 CajViewer

说明:CAJViewer 6.0全文浏览器是中国期刊网的专用全文格式阅读器截至 2005 年 5 月为止的最新版本,是5.5的升级版本,修改了一些老版本中存在的问题,如:打印、显示乱码,部分KDH文件的浏览问题,同时新增加如下功能:图书管理功能,支持单页\连续页浏览模式、知识元链接、自动滚动,文字编辑功能可将选择的内容发送到指定的Word文档,页面定位更加方便,支持书签、注释、高亮、直线,曲线、下划线,删除线和自定义知识元等八种标注功能,并有专门的标注窗口对它们进行管理,可对标注信息进行编辑,方便的书架管理让您更易于管理书籍,更加强大的搜索功能让您更加容易查找到感兴趣的文本,并且能迅速定位到文档的相关位置,友好丰富的帮助功能必定使您更容易掌握这款先进的产品。(OCR技术由清华文通授权使用)。

http://202.38.232.5/CAJViewer6.0_OCR.msi

使用步骤如下:

1。启动该软件。

2。打开PDF文件。

3。点击软件顶端一排按钮中的“文字识别”按钮。

4。用鼠标选定你要OCR的PDF文字的范围。

5。松开左键,等一下,文字结果就出来了。OCR的效果至少比别的自带OCR的浏览器要好。


不知道管用不
-----------以我的经验,清华的OCR比不上微软office2003自带的OCR,还差不少呢。
-----------我们可以试验一下,哪个好用用哪个。多组织几个朋友一起来。
锯响就有末啊
-----------
Originally posted by 鱼翔浅底 at 2005/12/11 00:21:
我们可以试验一下,哪个好用用哪个。多组织几个朋友一起来。
锯响就有末啊

支持你。应该多多的比较一下。
-----------。。。。。。年底了,事情太多。最近俺怕是做不成试验了
-----------
Originally posted by wesleybb at 2005/12/10 17:07:
以我的经验,清华的OCR比不上微软office2003自带的OCR,还差不少呢。

微软的今天我装了,怎么识别不了啊?
老是跳出如下图的咚咚!
叫我设置语言,我设置不了啊,老是这一个选项!郁闷!
是不是因为没装扫描仪的缘故哦?
附件: 你需要登录才可以下载或查看附件。没有帐号?注册
回复引用

举报返回顶部

如原
  • 发短消息
  • 加为好友
如原当前离线
阅读权限
30 
积分
224 
注册时间
2006/3/29 
最后登录
2010/12/11 
在线时间
601小时 
精华
日志
主题
帖子
216 

中级用户

中级用户, 积分 224, 距离下一级还需 276 积分
9#
发表于 2006/6/5 14:01|只看该作者
Originally posted by 鱼翔浅底 at 2005/12/10 12:49:
pdf直接ocr没做过,我都是自己把书扫描成tif,刚才搜索到一些信息,贴出来供参考

软件名称 CajViewer

说明:CAJViewer 6.0全文浏览器是中国期刊网的专用全文格式阅读器截至 2005 年 5 月为止的最新版本,是 ...


最近想做黄竹斋老"伤寒杂病论会通"上网查了一下pdf to ocr 也是发现CAJViewer这个软件,用了一下,使用ftp上的pdf檔,ocr的效果还不错,只是我不会简体打字,我是ocr成繁体, 现己ocr了三分之一,初校完后再请大家来帮忙校对(可能会繁简分开来校对),
-----------非常不错,此举将消除偶等文本一族的大苦恼,谢谢楼主和出力的哥们
相关文章
版权所有:医学全在线(m.med126.com)
Baidu