Others

一种宋词自动生成的遗传算法及其机器实现

2011-01-30. Category & Tags: Others Leading, Others

自厦门大学和浙江大学的三位学者开发的“宋词自动生成(的)遗传算法”,主要针对宋词这种特殊的汉语诗歌体裁,设计了其自动生成算法及其实现方法。 3 个示例: keyword=菊 Ci Pai=清平乐 Style=风格婉约 相逢缥缈,窗外又拂晓.长忆清弦弄浅笑,只恨人间花少. 黄菊不待清尊,相思飘落无痕.风雨重阳又过,登高多少黄昏. (这篇写的真的太NB了。。。) keyword=饮酒 Ci Pai=西江月 Style=风格豪放 饮酒开怀酣畅,洞箫笑语尊前.欲看尽岁岁年年,悠然轻云一片. 赏美景开新酿,人生堪笑欢颜.故人何处向天边,醉里时光渐渐. keyword=佳人 Ci Pai=点绛唇 Style=风格婉约 人静风清,兰心蕙性盼如许.夜寒疏雨,临水闻娇语. 佳人多情,千里独回首.别离后,泪痕衣袖,惜梦回依旧. —-节选——————————————————– 根据宋词特点设计了基于平仄的编码方式,将“平、仄”与“0、1”编码相对应的编码方案.比如词牌《清平乐》平仄分布如下: ⊙平⊙仄,⊙仄平平仄.⊙仄⊙平平仄仄,⊙仄⊙平⊙仄. ⊙平⊙仄平平,⊙平⊙仄平平.⊙仄⊙平⊙仄,⊙平⊙仄平平. 其中⊙表示可平可仄.根据我们的编码方案可得如下编码串: 01,1001.10011,101. *0 100,0100.101,0100. ………. 通过对大量宋词语句构成的分析,发现组成句子的有效模式的数目是有限的,并且呈现出了层次化的结构,因此比较适合采用DFA(deterministic finite automata)来表示。随机组合的词语,在产生大量的备选个体后,逐个进行DFA 分析测试,通过留下,没通过则剔除。 ………. 宋词的语义计算问题,包括词义相关度计算、词义相似度计算,以及风格情感一致性计算3 个方面。计算词义相关的目的是建立词语间的关联,发掘词语共现和搭配的可能,从而保证生成诗词行文和主题上的连贯.我们可以基于语料库统计来给出利用潜在语义分析和互信息两种方法词义相关度计算方法…….利用潜在语义分析(latent semantic analysis,简称LSA)和是基于互信息(mutual information,简称MI)的方法计算词义相关度…………对于最终的计算结果,我们首先选取两种算法的重叠部分,相关度则用两者各占50%的加权和表示;其次对于不重叠的部分,我们按相关度从高到低进行排列,并保留相关度大于10−3 的词。 ………….. 词语相似度主要用于衡量文本中词语的可替换程度.计算词义相似度,目的是在保证所选词紧扣主题的前提下,尽量使生成诗词的语言更丰富多变.目前自然语言的词义相似度有两类常见的计算方法,一种是利用大规模的语料库进行统计,另一种是根据本体知识来计算。……..考虑到计算的复杂性和词义相似度在应用中较强的针对性,在实际计算相似度时,我们仅对词库中高频名词545 个和形容词367 个近义词集进行计算。 …………… 有了具体的宋词生成算法,就可以构建宋词自动生成系统,按用户输入的关键词(要求输入1∼3 个关键词)和词牌名自动生成宋词.实际系统共分数据库建立、句法语义处理、基于遗传算法的生成3 个基本模块.实际系统是在普通微机的Windows 平台上采用VisualC++ 6.0 开发实现的,测试机器基本参数为:CPU 1.83GHz,内存512 MB.目前系统仅支持10 个常见词牌的宋词生成,这10 个词牌分别是《蝶恋花》、《青玉案》、《清平乐》、《浣溪纱》、《西江月》、《点绛唇》、《鹧鸪天》、《江城子》、《长相思》、《浪淘沙》。 例如,取种群大小k1 为100,最大进化代数k2 为5 000,交叉概率k3 为0.8,变异操作次数k4 为3 000,变异概率k5 为0.15,父代接受概率k6 为0.3.当输入主题关键词为“菊”,词牌名为《清平乐》时,系统经过如下运行过程. 首先系统提取主题关键词“菊”,在词义相似和词义相关库中进行查找,形成表1 所示的计算结果.接着,系统根据《清平乐》词牌的要求随机生成两个韵部.上阙仄韵“小”,下阙转平韵“魂”,即随机生成了一个平声韵部和一个仄声韵部.规定每个个体中至少出现一个与主题词的词义相似词.生成的初始种群个体举例如下(之一): 登临多少,入夜催秋草.憔悴田园添缠绕,携手光阴欢笑. 金菊零落离魂,春风相近黄昏.为我悲秋斜倚,此生天气重门. ...

为什么起床后不能收邮件?

2011-01-25. Category & Tags: Others Others

source from: 阮一峰的网络日志 我的习惯一直是收邮件。当我读到下面这篇文章,才震惊地发现,这样做是十分错误的,反映了我控制行为的能力十分低下。 这真是惨痛的教训,为了引以为鉴,我把全文翻译了出来,希望别的朋友不要再犯同样的错误。 ========================================== 为什么起床后不能收邮件? 作者:Sid Savara 译者:阮一峰 原文网址:http://sidsavara.com/personal-development/do-not-check-email-in-the-morning 英国作家Richard Whately说过: “在早晨浪费一小时,你得花一整天来弥补。"(Lose an hour in the morning, and you will be all day hunting for it.) 每天早晨,你不应该把收邮件当做起床后的第一件事。我有七个理由证明这一点。 一、它会降低效率 对电子邮件毫不关心,其实是一种福气。如果你手头有重要的事情急需完成,我只有四个字送给你:“别收邮件。” 你一起床,就用30–45分钟,集中精力去做最重要的事情,然后再去收电子邮件。如果你忍得住,不妨等待更长的时间。我经常是午饭后才打开邮箱。 你知道吗?只要对其他事情毫不关心,你就能把所有精力集中于手头的工作。 不收电子邮件,你就不会知道某地又发生了火灾,或者某个品牌在搞特卖,或者某个好友推荐的好玩的视频。 你得到的任何新的信息,都能使你分心。顺便说一句,这也是为什么我往往早上不看任何报纸、电视、不听广播的原因。我不想分心。你控制不了别人,但是至少能够控制自己集中注意力。 二、它不属于你的待办事项 如果你知道自己最重要的事情是什么,或者知道每天应该完成的事情是什么,那么起床后首先就去做。 要是这时你去收邮件,很可能你会做别人让你做的事。每当你打开一封邮件,你就应该衡量一下,是你自己的事情更重要,还是别人的事情更重要。在现实中,又有多少人能够看到别人的要求,却坚持去做自己的事呢? 如果坚持不住,那么最终你忙忙碌碌的,都是别人的任务(即使那只是回复邮件、提供一点意见),而不是你自己的任务。 说穿了,打开邮箱,那一封封的电子邮件都是别人给你安排的代办事项。 你的时间到底属于谁?你自己,还是某个给你写信的人? 三、它是缺乏目标的借口 我来问你:为什么你每天早上第一件事是收邮件? 答案往往是因为你不知道你该干什么。 每个人免不了都有这样的时候。但是如果你频繁查看邮箱,你应该警惕了,这是一个信号,表明你已经有点偏离方向了。 我的意见是,你必须去做的重要任务,应该放在第一位,别让查看邮件、清理书桌之类的琐事分你的心。如果你每天早晨习惯性地打开邮箱,真正的问题倒还不是你浪费了查看邮件的时间,而是你不知道自己的高优先性任务是什么,所以才会去做查看邮件那样的低优先性任务。 当你不知道什么事情最优先的时候,你把查看邮件当做自己的当务之急,无法完成那些真正紧要的事情就是你的代价。 四、被动与主动 查看邮件的时候,最好的结果是正好收到一封非常重要的邮件,不早不晚,然后你立刻采取相应的行动。但是,这样的情况很常见吗?非常少见。 更常见的情况有两种。一种比较"好"的情况是,你没有收到任何新邮件,也就没有什么新的事情需要做。但是,不管怎样,这时你浪费了检查邮件的时间,你可以减少查看的频率。 但是,这种情况有多常见呢?你遇到的往往是一种较坏的情况:你为自己找来了更多的事需要做。因为你在"收邮件”,所以你开始回复它们,浪费了你本该用来做别的事情的时间。你不是"主动地"为自己设置一个日程表,新收到的电子邮件迫使你"被动地"行动,迫使你忽略了它们真正的优先性。 我宁愿主动,宁愿去做那些对自己重要的事情,而不管收件箱里有什么紧急的或者排在前面的邮件。 别再浪费你的一举一动,你要多做生产力比较高的行动。 五、寻找借口 就我而言,如果我盲目地打开邮箱(或者Twitter、Facebook、以及类似的浪费时间的网络行为),我经常不是在查找重要的东西,而是在寻找借口,不去做那些我必须做的事情。 我在寻找理由,我想告诉自己为什么那些事可以拖到以后做。(“我必须帮助张三写完他的报告”,或者"我必须回答李四的问题"。) 不要落入这种陷阱。不要让收邮件变成一种你放纵自己的借口。 如果你手头正在做一件事,那就别查看邮件。承认吧,你有不得不做的事情,那就去做它。 六、没法设置时间限制 开会是一种很浪费时间的行为,但是大多数情况下,你至少知道会议需要开多久。 如果我问你,打开邮箱后,你将在邮件上花费多少时间。你很有可能无法回答,或者低估了耗费的时间。 查看邮件只需要一分钟,问题在于你会被随之而来的事情拖住,无法知道完成那些事情要耗费多久。事实上,我曾经在起床后打开邮箱,结果就陷在里面了,直到午饭时才得闲。 一天之中,你效率最高的时间是有限的。别让邮件把你拖住,耗费掉你宝贵的时间。 七、它带来期待 许多人说:“我不得不收邮件!别人期待尽快收到我的回复!” 首先,我不相信这种说法。确实有一些尽快回复的要求,但是它们可能远不如你想的那么紧急。其次,就算尽快回复是唯一的选择,你不妨问自己为什么会这样。 你知道吗,为什么别人期待你尽快做出回复? 原因可能是,你总是每天一醒来就回复邮件,你自己造成了别人的期望。 你越频繁地查看邮件,人们就越相信你会很快地回复。你不再每天早早地查看邮件,人们也就不再期望你会尽快回复了。 好的,我知道说来容易做来难。别担心,坚持一两个星期,就没人会对你有奢望了。 ...

关于VeryCD下载的关闭

2011-01-25. Category & Tags: Others Others

VeryCD关闭音乐视频下载 央视称盛大文学很黄很暴力 影著协不应是版权利益争夺者 电视推广和网络推广实例对比 电视引领“低智商社会” CNTV除了垄断还能做什么 深圳数字电视和深圳电信IPTV的对比评测 中国网络电视台开播的三大看点 国家队上场——中国网络电视台今日开播 深圳数字电视七宗罪 广电部和互联网 很好很强大,很黄很暴力 广电总局:今后恶搞短片传播须领取许可证 为什么广东人不看央视 卫星电视台竞争加剧 互联网文化与电视文化的碰击与重构 有线电视升级为数字电视 香港本地电视台简介

完全用命令行工作 — 一年后的思考

2011-01-25. Category & Tags: Others Others

一年前, 我在博客上陆续写了好几篇”完全用命令行工作“的文章. 这些文章介绍了一些我平时用的的基于命令行或纯键盘的工具和命令. 而之所以强调纯键盘(不用鼠标), 是因为我发现拔掉鼠标纯用键盘, 能大幅度的提高工作效率. 这也是我写这个系列的初衷. 其实, 命令行的, 或者支持键盘工作的程序层出不穷,如果做个有心人, 每周几乎都能发现新的甩掉鼠标提高效率的工具。比如说,这一年中我就发现了如 keynav 这样使用纯键盘和二分法定位屏幕的程序,更多的支持 vim 键位的各种浏览器, 编辑器插件. 所有的这些工具, 用起来都非常酷(事实上不用鼠标本身就很酷). 因此,单从好用的工具来讲,”完全用命令行工作” 这个系列每月都可以写一篇. 一年过去了, 随着我更多的使用纯键盘工作, 我发现, 其实和用什么工具没多大关系, 掌握了一个基本原则之后, 那些工具顺手就可以找到. 什么是我想说的基本原则呢? 时隔一年, 我觉得可以总结成一句话: 鼠标更加容易分散注意力, 且输入带宽没有键盘大. 为什么说鼠标分散注意力呢? 我在“拔掉你的鼠标” 这篇文章中有过说明: 鼠标在屏幕上不受我们注意力的边界约束, 很容易使我们的注意力分散到各种地方, 成为工作效率的敌人。如果用时间管理眼光来看, 鼠标甚至可以说是时间管理的敌人 – 鼠标可以让你随时用一个窗口跳到另一个窗口, 一个关注点跳到另一个关注点, 使得你的时间规划失去效果. 我发现拔掉鼠标之后,上网不会乱点,无聊的时候不会点着好友的头像开始聊天,或者没事整磁盘碎片等等。拔掉鼠标的目的, 是为了提升工作效率. 当然我也知道, 拔掉鼠标是属于治标不治本的一种办法, 好在大部分浪费时间的应用都依赖于鼠标, 拔掉鼠标后想浪费时间也无从下手了. 所以在短时间之内的确算是一个提高效率的有效方法. 当然, 真正会把握自己时间的人, 是不会像上面提到的那样因为鼠标而分散注意力的. 即便这样, 鼠标也不见得有键盘好用. 用理论上来说, 鼠标这个“信息通道” 的带宽太小了,相比较于键盘, 鼠标向计算机传输同样的信息可能要花费更多的时间. 一个最简单的例子就是快捷键. 键盘快捷键不光比用鼠标在多级菜单中点来点去快, 甚至也比移动鼠标单击一个图标快. 究其原因, 还是因为鼠标操作图形界面是一种间接的给计算机发指令, 而用键盘快捷键相对直接一点. 只有在移动焦点和点击选择定位位置的时候, 鼠标才比键盘高效. 这一年, 我发现虽然还不能 100% 的抛弃鼠标, 但可以说 95% 的情况下, 鼠标的使用都是可以避免的. ...

苏格兰一提款机乱派钱 银行决定不向提款者追讨

2011-01-23. Category & Tags: Others Others

中新网1月23日电 据新加坡《联合早报》报道,英国苏格兰邓迪市的一台提款机,上周四晚突然胡乱吐钱,要50给100。不过,设置该提款机的银行过后表示,不会追讨多发出去的钱。 据报道,发生故障的提款机设在邓迪市的一家商店前。警察接到通知赶来关闭提款机时,已有不少居民风闻而来取款。匿名者透露,最多人的时候,估计有五六十人在排队。 查看:英国提款机突然“吐钱” 现场数十人疯狂挤兑 安装提款机的银行机器有限公司(Bank Machine Ltd)不愿透露,他们究竟损失了多少钱。不过,他们表示,不会追讨多发出去的钱。至于顾客要不要退还多领到的钱,可凭良心决定,但该银行至今没接到表示要退钱的电话。 该银行董事经理德尔尼沃说,提款机乱了套是因为装钱的匣子设置错了。 他说:“如果人们把这视为好玩,赶来提款机提钱,那也无所谓。”

VeryCD遇七年变局:下载服务关闭 不涉及关站

2011-01-23. Category & Tags: Others Others

昨日晚间国内著名资源分享网站VeryCD,突然进行内容方面的大规模调整,其中音乐频道已经关闭,影视内容跳转向在线观看的电驴大全页面。据悉,VeryCD几个主要下载分类都会关闭,但尚不涉及关站。 VeryCD正面临成立七年以来的最大难关。 从昨晚开始,陆续有网友发现VeryCD的音乐频道出现无法访问的情况,而访问电影和剧集的内容会跳转到电驴大全页面,只剩下主要来自其他视频网站的在线视频内容可以观看,同时页面上没有任何下载地址对外提供。 与之相呼应,VeryCD创始人黄一孟也在其新浪微博上说:“7年的心血和积累,说关就要关,说停就要停。没有人能甘心,但也早料到这一刻会突然到来。现在所能做的,维有面对现实,准备好勇气,即使全部推倒从头再来,我们也绝不放弃”。 据悉上述举措,与VeryCD没有取得网络视听服务许可证等资质有关。而坊间也发出VeryCD即将关站的猜测。然而事情并没有想像的那么糟。 有VeryCD内部人士对新浪科技透露,尽管VeryCD在进行内容方面的大规模调整,几个主要的分类下载将会关闭,但并不涉及关站问题。不过,VeryCD的服务器仍然再次出现访问量猛增的情况。截至今日凌晨一点半左右,此次负载高峰暂时告一段落。 由于此次调整比较突然,很多VeryCD的员工并未做好相应的准备。目前,VeryCD的员工已经开始筹划明日恢复音乐列表信息。 关于VeryCD的未来,黄一孟在其新浪微博上的说法,或许是最好的注解:“全面正版是社会进步的表现,我们对此并无怨言,VeryCD去盗版化是顺势而为,目前所需要做的,是如何帮助用户便捷得获取到正版内容”。 2009年底,随着BTChina等网站被关停,VeryCD的命运一直为外界所关注。当时坊间就有消息称,“电驴下载将在本月内关闭,而VeryCD将开始全面转型SNS交友网站,依托VeryCD常年积累的人气来打造‘电驴乐园’”。 不过这一说法很快被黄一孟否认。此后VeryCD开始尝试申请视听牌照。然而截至目前为止,并未有消息证明VeryCD的牌照申请获批。 新浪科技

Two Suns? Twin Stars Could Be Visible From Earth By 2012

2011-01-23. Category & Tags: Others Others

Earth could be getting a second sun, at least temporarily. Dr. Brad Carter, Senior Lecturer of Physics at the University of Southern Queensland, outlined the scenario to news.com.au. Betelgeuse, one of the night sky’s brightest stars, is losing mass, indicating it is collapsing. It could run out of fuel and go super-nova at any time. When that happens, for at least a few weeks, we’d see a second sun, Carter says. ...