2021新的一年

题记

The data cannot speak for themselves; and they never have, in any real problem of inference.

《Probability Theory: The Logic of Science》—— E.T.Jaynes

回顾和展望

一年前的这个时候是个什么状态呢?刚搬到自己的房子,工作是处理一些jira,额外的训练貌似没有系统。后来疫情开始了,打乱了大部分人的生活,其实对于我,疫情重新理顺了我的生活。我开始有条不紊的计划,身体和技术上的训练。也就有了每月固定的计划和总结:https://kainwen.com/category/month-record/. 在此也没什么特别需要说的了。

Continue reading

2020年 十二月·不抛弃不放弃

题记

不抛弃不放弃,所以我们就叫钢七连。

高成——《士兵突击》

计划

  • 继续阅读Logic of Science
  • 研究ICC,训练编程能力
  • 构思多阶段Agg是否可以写一篇论文

总结(2020.11.01)

  • logic of science终于又开始阅读了,重复过了一下之前研究过的,多看懂了作者的一些思路,这书写的真是好
  • ICC也开始看了,也有一些收获
  • 并没有构思太多,还是在继续调优GP的性能

2020十一月·雄关漫道真如铁

题记

西风烈,长空雁叫霜晨月。霜晨月,马蹄声碎,喇叭声咽;雄关漫道真如铁,而今迈步从头越。从头越,苍山如海,残阳如血。

《忆秦娥·娄山关》——毛泽东

计划

  • 把论文写好并投出
  • 调节生活和工作的身体和心理状态
  • 下一个月准备开始研究SAT相关的MOOC

总结(2020.11.01)

  • 论文总算投出去了,期待能中,这个过程得到了很多朋友的帮忙
  • 论文投出去后心理状态还多了,了解一个事儿,身体上,胖了一点,需要减脂,腰部翻轮胎没热身受伤了,需要积极康复。
  • SAT相关的MOOC已经完成了,细节算法领悟不深,但是感觉可以用SMT工具在数据库里做一些事儿了,需要跟朋友聊聊看。

2020.10.09清华大学摔跤训练笔记

感慨一下

在多位同学的努力下,我终于经过正规的手续可以返回学校和大家一起训练摔跤了。这似乎是2020年我第一次返校。摔跤这个项目是对身体素质和心理素质要求都是极高的,这也说明我们可以通过训练获得两者的提升。清华大学的学生们绝大多数都有坚韧的意志力,所以,训练摔跤,只要有兴趣能下功夫,也能出来极高的水平。不过,克服苦难,超越对手和自己产生的正反馈,身体素质的综合提升,是训练这个项目的更重大的意义。

Continue reading

清华大学2020年秋季学期摔跤训练计划

概述

摔跤训练是非常综合的竞技体育项目。学校社团的同学身体素质和基础不同,要因材施教且同堂课可以根据基础区分训练内容。

训练标目

  • 对于有基础身体或者身体素质不错的同学,使手法技术更纯熟,专项身体素质更好,实战能力更强
  • 对于零基础的同学,培养竞技体育精神,提高综合身体素质,理解摔跤手法和技术原理,能熟练配合技术,掌握受身倒地保护自己的技术,并在后半期参与几次实战
Continue reading

2020十月·人间正道是沧桑

题记

天若有情天亦老,人间正道是沧桑。

《七律·人民解放军占领南京》——毛泽东

计划

  • 继续研究复习Logic of Science
  • 训练Compiler (用LCC这本书)
  • 完成HTAP论文初稿
  • 这次必须玩命控制住体重

总结(2020.11.01)

本月没有任何额外的学习,原因在于国庆休假在我母亲没有回来之前,大量时间花在了陪伴慕慕上。同时,需要准备论文和多次讲座。体重在最后一周开始控制饮食,目前看起来还行吧。

Coupon collector’s problem: sample without replacement

Problem

About one year ago, in the post Coupon collector’s problem:An infinite-series perspective I come up with a solution to asymptotically answer the following problem:

The cardinality of the data is n, for each distinct group, there are a duplicates. Suppose we want to use hash aggregation algorithm to do some computation, each time you uniformly sample one data and push it in the hash table (capacity is just n), exactly right after sampling m data, for the first time you find that the hash table is full. What is the expectation of m?

The above problem is a model of sampling without replacement. One year ago’s solution is with replacement. Recently, I am reading the book Probability Theory: The Logic of Science. It gives me some idea so I come up with a solution.

Continue reading

2020九月·略不世出

题记

足下涉西河,虏魏王,禽夏说,引兵下井陉,诛成安君,徇赵,胁燕,定齐,南摧楚人之兵二十万,东杀龙且,西向以报,此所谓功无二于天下,而略不世出者也。

——《史记 · 淮阴侯列传》

计划

  • 继续研究PAIP争取完成逻辑编程的部分
  • 继续研究Logic of Science,争取把第一部分弄扎实
  • 严格执行训练、控体重
  • 有时间看一些非技术类的书籍

总结(2020.09.30)

  • PAIP逻辑编程搞了一部分,后面的例子兴趣不是很大
  • Logic of Science复习了前三章,并给出了不放回的抽样公式
  • 体重有点难以启齿,摔跤技术倒是提升了
  • 非技术类书看了《沉默的真相》和原著