陈志武:为什么我们需要量化历史研究

  • 时间:
  • 浏览:0

历史研究领域的与时俱进

   2013年,笔者与清华大学龙登高、伦敦经济学院马德斌、香港科技大学龚启圣等教授同时举办了第一届量化历史讲习班。完后 ,大伙每年办一届。与四年前相比,报名人数太久,国内学界对量化历史研究的认知和兴趣都在了很大的变化。

   按照经济史学者诺斯的追溯,用量化最好的方法研究经济史问题大致起源于1957年,当时几位学者尝试研究美国黑奴历史的经济逻辑。我你要,量化最好的方法也用到了其它历史研究领域,包括诺斯对欧洲政治制度史、西波拉对西方教育史与宗教史的研究。到1930-70年代,量化史学变得流行,我你要这股风潮又有所消退。但1990年代中期后,新一轮量化历史研究热潮再度崛起,引人注目。就以国际五一定量化历史数据库为例(美国整合公共微观数据库IntegratedPublicMicro-dataSeries、加拿大巴尔扎克人口数据库BALSAPopulationDatabase、荷兰历史人口样本数据库HistoricalSampleoftheNetherlands、瑞典斯堪的纳维亚经济人口数据库Scandina-vian Economic DemographicDatabase和美国犹他人口数据库U-tah Population Database),306—2010 年间,新发表的学术论文中运用有有哪些数据库资料的就达2330余篇(梁晨、董浩、李中清:《量化数据库与历史研究》,《历史研究》,2015年第2期)。

   催生新一轮量化历史研究的经典作品主要来自经济学领域。而且,在咋样利用大数据论证历史假说方面,经济史学者做了什儿 最好的方法论上的创新,改变了以往社会学家、人口学家只注重历史数据描述性分析、相关性分析的传统,将历史研究进一步往科学化的方向推进。

   今天,计算机和互联网已相当普及,不仅什儿 历史资料的数据库化变得不可能 ,而且使有有哪些历史数据库的跨地区、跨国共享也成为不可能 。在互联网上,时要免费得到数不清的各国历史资料库,用起来方便,成本也低。这是完后 的历史学者做梦也想并能的。

   过去十几年,笔者与彭凯祥、袁为鹏、林展、何石军等团队,总爱致力于建立中国民间借贷利率史数据库、情感的说说与妻妾交易数据库、历代皇帝与反腐数据库、契约文书数据库。此外,都在不少同仁在建立历史数据库,包括“中国历代人物传记资料库”(CB-DB,由哈佛大学、台湾中研院、北京大学合作建设)、“中国地方历史文献数据库”(由上海交通大学建设)、“清代灾荒纪年暨信息集成数据库建设”(中国人民大学夏明方主持)、“清末民国社会调查数据库”(中国人民大学黄兴涛主持)、“数据历史黄河”(陕西师范大学建立的黄河流域各地的历史地理、气候、社会、灾荒等资料库),还有中国科学院地理所、复旦大学、北京师范大学等等分别或合作建立的历代或近代气候与灾荒历史地理数据库。

   当然,众一定量化历史数据库什么都有有 研究的基础,关键要看研究最好的方法与分析框架不是跟得上。什儿 同仁提出,量化史学都在另十个 时兴一段,但我你要势头又下降何时?这次为有哪些会不同呢?大伙时要看一遍,1930年代完后 电脑没法普及,更没法互联网,那时收集历史大数据很难,做统计回归分析并检验假说也很难。而且,现在没法有有哪些问题了。

   今天“大数据”是个时髦话题,另十个 ,什么都有许多人没法看一遍历史资料是真正的大数据。比如,仅清代刑科题本档案都在近30万本,平均每本大慨30页手稿,加在同时什么都有有 130万页资料。更暂且其它明清及民国期间留下的奏折、公文、实录、文书、契约、方志等史料,加在同时大慨有数亿页。

   采用细读个案的传统历史最好的方法,不仅会让大伙偏重树木而忽视森林,而且,当历史资料规模超过一定水平时,什儿 最好的方法很难行得通。海量历史资料带来十个 问题:一是不可能 传统最好的方法强调细读一手史料,近代史比远古史更难研究,不可能 明清资料太久而古代资料很少,并能靠引入新的研究最好的方法并能改变什儿 奇怪局面;另一问题是不可能 传统最好的方法强调个案细节、不强调大样本,但历史上的社会问题又错综繁复,研究者什么都有有完后 都能根据时要选则到“合意”的历史案例。什么都有有,在不同学者根据时要去找合意个案的习惯下,得出的结论当然各异,都在了“历史被任意化妆”的嫌疑。大伙时要改变有有哪些问题,就要靠大样本量化最好的方法。

   而且,量化史学都在热潮不热潮的问题,什么都有有 史学研究时要探求的新最好的方法。而且,大伙难以适应新技术带来的便利和挑战。中国历史资料充沛,这是中华文明的优势,而且,要发挥什儿 优势、增加大伙所许多人乃至全人类对大伙过去的认知,就时要改进研究最好的方法。量化历史最好的方法既受益于现代互联网技术,也受益于现代社会科学分析范式的进步,是历史研究领域的与时俱进。

   接下来,本文将回答以下几只常见问题:第一,量化历史最好的方法跟传统历史最好的方法是有哪些关系?第二,历史并能量化吗?第三,1990年代末期以来的量化历史研究最好的方法跟完后 的区别在哪里?最后,量化史学除了证明或证伪传统史学提出的假说外,能带给大伙对历史的新认知吗?

对传统历史研究的补充

   量化历史最好的方法都在要取代传统历史研究最好的方法,什么都有有 对后者的有什儿 补充,是把科学研究最好的方法的全过程带入历史领域。

   量化史学和传统历史学研究,同样注重对历史文献的考证、确认。不可能 原始史料收集出了问题,不管采用有哪些研究最好的方法,由此推出的结论都难言可信。两者的差别在于量化最好的方法会强调在史料的基础上尽不可能 寻找其中的数据,不可能 即使没法明显的数据也时要努力去量化。

   不管是自然科学还是社会科学领域,科学研究最好的方法的基本流程是一样的:第一步是提出问题和假说;第二步是根据提出的研究问题和假说去找数据,不可能 通过设计实验产生数据;第三步是做统计分析、检验假说的真伪,包括选则大慨的统计分析最好的方法识别因果关系、做因果推断,处理把虚假的相关性看成因果关系;第四步是根据分析检验的结果做出解释,挖掘清楚“因”意味“果”的实际传导机制甚为重要。为给出令人信服的解释,既可通过统计最好的方法认证逻辑传导机制,也可通过简单数学模型验证传导机制的逻辑一致性;第五步什么都有有 写报告不可能 文章,把科学过程研究出的结果报告出来。

   传统的历史研究范式基本等待英文在上述科学最好的方法的第一步和第二步,要么先提出问题或假说,真是“历史应该是另十个 ”,而且去找历史个案或少数几只案例,可是我我假说与有有哪些个案相符,就认为假说对历史的解释是成立的;要么先通过对历史个案的透彻研究,得出关于历史问题中因果关系的假说或猜想,认为历史中什么都有有 另十个 由什儿 “因”意味那个“果”的,而且研究就到此结束。

   史料收集是建立历史数据库的基础,在没法经过大样本检验完后 ,有有哪些假说和猜想还仅仅是假说,不一定真的成立。量化研究是在传统研究最好的方法的基础上,把科学最好的方法中的第二步(收集大样本数据)做好、做完,而且把第三步、第四步也做完。并能另十个 得到的历史问题面前的“历史规律”,并能处理“以偏概全”。什么都有有,量化历史最好的方法是对传统最好的方法的补充,而都在取代。数据是量化研究的基础,但什么都有有 其中十个 环节,同样重要的是要根据历史大数据对大伙感兴趣的猜想进行统计检验,看什儿 猜想不是能得到大样本的支持,而什儿 点是传统历史最好的方法难以做到的。

   过去,胡适先生也讲过“大胆假设,小心求证”,只不过当时他所讲的求证,还什么都有有 一般的寻求证据(主什么都有有 文献方面的),并都在统计学分析与大样本检验。比如说,到底是有哪些意味清朝灭亡?有什儿 假说(仅仅为假说)是:不可能 晚清立宪改革所致,并据此得出结论说“并能进行宪政改革,不可能 宪政改革意味国家灭亡”。根据清朝的个案经历得出另十个 的结论,就好比“阿炳二胡拉得好,是不可能 他是瞎子,什么都有有任何人要拉好二胡,时要先把眼睛搞瞎”,显然是以点带面。大伙时要先收集中国与什儿 国家的宪政改革历史样本,进行系什么都有有计检验,排除个案的特殊因素,让样本中的同时因素——宪政改革——突出出来,凸显“历史规律”的内涵,另十个 并能知道什儿 假说到底时要站住脚。

难以量化不等于并能量化

   在历届量化历史讲习班及其它交流中,十个 总爱听到的问题是:历史并能量化吗?初看,问得有道理,不可能 什儿 历史问题和因素真是难以量化。而且,难以量化不等于并能量化,尤其不等于要放弃想象力和创新的努力。

   以香港科技大学龚启圣和山东大学马驰骋最近的一份研究为例,大伙的核心问题是咋样测度儒家文化的影响并评估真是际贡献。大伙都说儒家文化过去两千多年对中国社会贡献巨大,是中华文化的基础。但咋样证明儒家文化的积极作用?其发挥作用的最好的方法不可能 说机理到底是有哪些呢?

   儒家文化的成本很高,尤以对所许多人自由与权利的压制为突出,其核心原则是以君与臣、父与子、夫与妻的“三纲”为基本出发点,把每所许多人从出生到死都固定在十个 根据辈份、年龄、性别决定的名分等级秩序之中。基于儒家名分等级秩序所实现的资源分配组织结构、收入分配体系,要求所许多人有点痛 是老婆牺牲没法多、代价没法大,带来的贡献是有哪些?贡献有几只?学术领域鲜有对有有哪些问题的量化答案,意味当然是文化很难量化。

   龚启圣、马驰骋尝试用间接代理指标来量化“儒家文化影响的强弱”,亦即,用各县文庙或孔庙数量测度儒家文化的影响强弱:孔庙太久,儒家在当地的影响就越强。此外,自汉代结束,政府实施旌表节烈妇女的制度,但直到宋代完后 ,妇女守节、殉节的问题有但暂且普遍,再嫁、改嫁行为也还总爱所处。宋代理学家程颐、朱熹按照“存天理,灭人欲”、“饿死事极小,失节事极大”的思路,强调寡妇再嫁什么都有有 失节。朱元璋1368 年创立明朝后,即颁布诏书:“民间寡妇,三十完后 夫亡守志,五十完后 不改节者,旌表门闾,免除本家差役。”1723 年清廷规定:“节妇年逾四十而身故,计其守志已逾十五载以上,亦应酌量旌奖。”于是,清代的旌表标准缩短至守节十五年,其后又分别于1824 年和1871年进一步缩至十年和六年。正不可能 守节是儒家“养子防老”体系的价值延伸,十个 县的烈女数量也大致能反映当地人对儒家文化看重、遵守的程度。就另十个 ,大伙找到了量化儒家文化的十个 代理变量。

   龚启圣、马驰骋研究的目标是清代1644-1910年间山东107个县的农民暴动状态,看儒家文化不是会显著降低各地遭遇灾荒冲击时农民暴动的冲动。通过检索《清实录》历史档案,大伙发现,这期间山东南部各县农民暴动最频、次数最多,其次是青岛俯近山东东北角的有有哪些县;而孔庙数量的分布则倒过来:中部各县孔庙数量最多,南部和北部县大慨。在排除各种其它因素的影响完后 (包括每个县的收入水平、起初发达程度、教育水平、社会流动性等),受儒家文化影响太深的县(即孔庙数量或烈女数量太久),即使遭遇灾荒冲击(通过粮价高低测度灾荒严重度),其在清代农民暴动的频率也更低。

而好的反义词有另十个 显著的结果,机理在于:儒家文化影响深的地区,家族宗族网络越强,在面对灾荒冲击时宗族组织组织结构互通互助的程度就越高,亦即隐性互相保险的程度就越强。这就减少灾荒迫使农民走投无路、求能够暴力的必要性。在严重不足保险市场等金融产品的社会里,(点击此处阅读下一页)

本文责编:陈冬冬 发信站:爱思想(http://www.aisixiang.com),栏目:天益学术 > 历史学 > 史学理论 本文链接:http://www.aisixiang.com/data/103888.html