2010/2011 杂记

发烧了,跨年之病。并不算严重,37.5' 上下,新的一年就这么开头了

淘宝上给达达买了一件CARAVA的冲锋衣。做工不错,袖子上的细节也很见厂商的用心。那些流入水货市场的户外产品基本不会有童装的,要给小孩买东西,这个牌子我觉得还是可以的

邱可心最近学会了第一句真正意义上的脏话——《卑鄙的我》的字幕组太给力了,里面充斥着“哥”、“爷”、“神马”这样的翻译,包括把"silly bean"翻译成了"傻B"。从发音上来看,这个翻译还挺不错的,但我开始担心回头她在学校里说脏话被请家长。老婆安慰说学校只有学习不好才请家长,这种事情也就写个检讨反思,哈!

看邱可心用"灰"组词,她先是组了一个"灰尘",然后组了一个"骨灰"..... :(

发现邱可心在造句的时候引用她爹弹琴很棒这件事,很是得意。

用"虽然...但是"造句,"虽然我学习很努力,但是怎么也考不了100分",小学二年级的心理哀愁

===============

翻了下去年的"2009/2010",实现了的愿望就一个"冠军杯"

2010 整个工作被割裂成两部分,下半年开始对搜狐有了更多的理解。

希望新年能给团队给搜狐带来大变化。新年愿望:
1. 对敏感词的诅咒生效
2. 父母健康平安

3. 爬一座5000+的山

就这三条吧,人不能奢望太多

Topic: dada 生活

再出发

又到一年的最后一天了。

今年这一年过得忙碌并且充实。从上半年的见双方家长、筹备结婚到下半年的结婚、买车。紧紧张张,一年就这么过去了。每个周末每个节假日几乎都是按照计划有目的地度过的。所幸并没有太辛苦太累,这一切的一切,都要感谢我美丽贤惠的妻子和不遗余力支持我们的父母兄嫂。

明年肯定不会轻闲,年龄越来越大,责任也越来越重。没什么太多想说的,继续今年的势头,再出发吧。

Topic: 生活

ノルウェイの森  (2010)

http://www.norway-mori.com/, 12/11 日上映,估计只能等从电驴上下载了,就算进中国也会被剪...

话说当年发现搜狐博客的slogan是"相逢的人会再相逢",很是吃了一惊,因为怎么也感觉不出来博客团队的几位领导有这么浓郁的文青气息。。。前个月idk小妹妹还给我说这个slogan的事情,以为是我的主意。现在博客多多少少和我有了点关系,就算不为老樊也要冲村上的面子,得好好支持一下,呵呵

Topic: 文化 音乐

Last Christmas

无意中发现最近两天总在收音机里放的这首圣诞歌原唱是威猛乐队。兴之所至去优酷搜索了一下,那时候乔治迈克尔好青春啊,现在已经是大叔升级版了...

Last christmas, I gave you my heart
But the very next day you gave it away
This year, To save me from tears
I'll give it to someone special

Topic: 生活 音乐

关于垃圾账号注册

淘宝一位同学在博客里提到他们是如何用贝叶斯和垃圾小号斗争的,里面点了 sogou 邮箱的名。那好,我这里也谈谈邮箱的工作情况。

对于我们邮箱服务商来说,垃圾账号带来的主要危害是利用免费邮箱的资源(包括 smtp服务)向外界发送垃圾邮件,最后导致我们的外发IP被加入黑名单,从而影响正常用户的信件往来。

而淘宝的情况则是用户注册邮箱后,并没有利用邮箱去发送垃圾邮件,而是用它在淘宝或者什么地方去 spam。。。这种情况对我们邮箱用户的信件往来不会产生危害,在研发资源有限的情况下,我们更关注怎么去对付滥发的行为。。。

今年3月19日,我们在检查垃圾账号的时候,发现有一组注册账号就是什么都没有做,但是收到了来自支付宝(或者就是淘宝吧)的激活信件,当时我们判断可能要做钓鱼,于是就通知了支付宝。但是对方的响应不是很热烈,回信的大致意思是这种情况很常见,搜狐自己处理好了。。。我们感觉对方并没有想和我们邮件服务商一起来解决问题的意愿,于是那我们还是继续关注邮件滥发吧...

最后还是要说明一下我们的立场:我们非常非常在意垃圾账号注册这件事,不仅仅是邮件滥发,也尽力避免我们的邮件账号不会被用来做其它不好的用途;如果上下游能一起来做这个事情,效果我想会更好

另外,保罗.格拉汉姆的a plan for spam和better bayesian filtering是我2003年夏天找人把它翻译成的中文发布的.

Topic: 技术

今日朝阳公园之树上穿越

朝阳公园这个快乐猩猩,原价是单人180,家庭三人300。现在有团购价是60,今天去玩了一次,还是很有意思的..

本来是想让她一个人去玩,结果达达刚刚走过初级难度第一段,就赖在安全岛上不肯走。我还没怎么拍照片,就被迫穿上安全带一路跟随;说是保护,其实就是跟在后面给点心理安慰——在绳梯上大人是帮不了什么忙的,训练有素的工作人员除外

走了1/3,又回到平台处,达达是说什么也不肯再走了,她爸爸在旁边利诱,她妈妈在下面威逼,越说越嚎啕大哭,渐渐的下面竟然聚集了十好几个人在看达达哭..

达达:爸爸妈妈你们老骗我
我:???
达达:老骗我干我不喜欢做的事情..
...
我说:只要你过去,我们一周晚上就不弹钢琴了
达达:(哭)我觉得走过去比弹钢琴要可怕100倍(大哭)
我说:只要你过去,我们100个星期晚上不弹钢琴了
达达:(大哭)我觉得走过去比弹钢琴可怕1000倍....

不过最后达达还是很勇敢的走完了初级的全部路线,Oh-Yeah! 她老爹也很无奈的跟在后面通过本来是给小朋友准备的障碍(非常非常不适应高度和宽度)

有个学前的小孩子是第二次玩,非常溜的就走完全程。初级难度看起来 5 岁以上就没啥问题了

中级难度必须1.4m才能去玩,达达明年就可以去尝试一下.

BTW: 这个活动也很适合 team building... 强烈建议

Topic: dada

O'RELILY Velocity 2010 纪要 a-z

Velocity 的资料下载在:http://velocity.oreilly.com.cn/index.php?func=slidesvideos

受了非人培训的感染,这次 velocity 会议,我给每个参会的同志都安排了作业——学习体会、行动计划等等;然后几份作业我主观打分,落后者和我一起AA请优胜者大餐

除了安排别人写作业,我也写写我自己的作业吧:

  • 网站速度是搜索引擎的 rank 指标

  • 淘宝采用了一台haproxy带两个squid的做法。。。当然这许多组(3x)服务器之前还有两个 lvs

  • 淘宝把系统分成了4个层次来优化:软件系统、服务器(web server、mysql、jvm)、kernel、hardware

  • 个人最喜欢 Java without OS 的想法

  • 北京电信访问北京联通比上海电信快

  • TTI 概念是 Facebook 提出来的么?Yahoo 的讲演里也用这个缩写:Time-to-Interact

  • BigPipe 概念其实挺简单的,我蛮想利用它对狐首做做优化

  • Pagecache 我觉得最难应用,对前后台工程的要求极高。(增量式更新、自动记录并回放、跨页面的服务器更新)

  • 前端工程师驱动Web平台技术更新是一个趋势,不过这对前端工程师提出了很高的要求。人人网的邵军辉今天在回答我的提问的时候自嘲其JavaScript比C++要强,我觉得这不是笑话,而是某种程度的真实。

  • YahooMail 也在用一个类 Bigpipe 技术,名叫 AjaxPipe,通道是 iframe,来生成首页的 Dashboard

  • Yahoo 提到 Pipeline-mode 有一个问题就是 SEO,针对爬虫必须有一个 single flush 的机制

  • Yahoo 更进一步发展出并行化的想法(single-flush -> pipeline -> parallel),当然现在还在襁褓阶段

  • 两个TFS看起来都很强大,我们要不要搞SFS呢?

  • 百姓网的虞冰不错,除了在上海,应该比淘宝和腾讯的人好挖

  • 把web性能和奖金挂钩,是一个好主意

  • 多个不同的讲演者多次强调,speed is a feature!!!

  • 要扩大 UED 团队规模,让工程师更专注在程序上——这条最佳实践来自YahooMail

  • Node.js + YUI3 + jsdom 开发服务器端应用。Yahoo这种思路某种程度上比 erlang 要靠谱,我现在真觉得这个工程上可行

  • Facebook的Web性能团队叫Pref SWAT,cool! 这个Web性能组应该是属于平台团队的,对应的是产品团队

  • passport module很适合做cookie monster。。。好吧,facebook需要这个是因为它只有一个产品www.facebook.com。。。但server-side cookie是好想法,server-side cookie is not session!!!

  • 产品团队用了多少平台团队提供的组件——这是衡量其代码质量的指标之一,Yeah!

  • Facebook有500名工程师;任何新人(真的是任何吗)都要进Bootcamp干6个星期的脏活。。。我也非常喜欢这个新兵营

  • 盛大的许世伟在阐述HTTP的stateless本质(虽然他一直在说存储层,或者说状态保持层),以及产品设计中API层的重要性

  • 把模板和碎片也应用版本管理(wiki的版本管理功能就足够)是个好想法;另外动态语言来写CMS貌似还是很有一定优越性的,尤其是PHP天生就是一个模板系统

  • 人人网用2台FastCGI顶替了40台Resin严重伤害了不少Java开发人员的感情,好多人质疑。。。我则关心人人网的C++程序员:Java程序员的比例是啥,邵军辉估算是1:5。。。其实蛮合理的,俺们需要下决心在C++程序员headcount上投资

  • 淘宝说它的基础监控除了cpu/mem之外还包括spinlock,这个真的把我震惊了;应用监控和业务监控不能仅仅指望TechNO,我们必须做得更多
Topic: 技术

电子邮件的未来

今天在Velocity的Yahoo Mail报告,主旨是关于UED的。但我提了一个非技术问题,“我们可以注意到Facebook刚刚发布了Unify Message Inbox,Yahoo Mail新的Beta也融合了大量SNS元素。。。那么雅虎怎么看待电子邮件的未来?”

一位女士blarblar讲了半天,电邮适用在很多场景下,电邮和SNS有很多差异等等...

这个事情自从fmail以来我就一直在思考,没有结论,至少目前还无法得出电邮已死的结论,说说我的各种混乱无序的想法:

* Email Inbox 是一个私密的应用场景,这和SNS是截然不同的;必须给用户安全感

* Email 的社交功能在被边缘化;什么是“社交功能”??

* IM 的社交功能也会被边缘化吗?

* 什么是 feed?什么是 message?什么是 chat/conversation?

* 什么是 reply?什么是 forward?retweet翻译成"转发",而reply成了评论

* retweet vs share(GoogleReader)

* SMTP+MIME vs 开放平台

* 做给别人看的(公共空间),和自己负责的(私人空间),是两个不同的东西

不管是退一步还是进一步,都比站在原地要好

订阅 RSS - BT的花