1851年的东说念主口普查是最早明确试图区分老板和其他东说念主,以及主东说念主和“男东说念主”的普查。
这亦然只是1851-81年的东说念主口普查本色公布了通盘非农业老板的东说念主口普查效果。这提供了两个有价值的元素:第一,瞻念察GRO奈何阐扬这个东说念主口普查问题的谜底;第二,比较和搜检I-CeM记载的内容,以及在原始CEBs顶用于识别个东说念主的索求体式。灾荒的是,很难与GRO的表格进行比较,因为不露出GRO究竟是奈何诡计其老板表格的。这些表格的标题是“老板(有男性东说念主数)”,标题宣称“表格包括这些东说念主”只是,谁,在户主的时间表,述说我方众人们,稳当印在每份附表上的说明”。GRO阐发承认,好多雇佣工东说念主的老板莫得慑服领导的“主要”部分,即使他们按照领导的后半部分复返了劳能源。
师父-纯熟工-学徒术语并不适用于通盘部门;畸形是专科东说念主员和工场等大鸿沟老板,并不老是称我方为“主东说念主”。“尽管如斯,大多数东说念主照旧复返了职责岗亭。其次,表格自大他们只统计了“男东说念主”。尽管东说念主口普查指南提到了“东说念主”。天然处事妇女和儿童无意在东说念主口普查司一级的表格中单独列出,但这只适用于大都雇用妇女和儿童的少数行业。然则,标题注视也提到了“主东说念主雇用的手的数目”,一些分部表有个别大老板的脚注,明确暗意它们包括复返性别中性描写符如手的老板——举例,第三分部中的“一个主东说念主雇用398只手”。
咫尺还不露出其他雇员的描写词发生了什么变化,如男孩、男性、纯熟工、学徒或任何其他处事头衔。农民更容易清爽,因为他们是由处事者和受雇的东说念主的数目明确列出的。妇女和儿童被明确撤销在这一统计以外,他们的东说念主数分别记载在每个表格的下方。将运行I-CeM索求的效果与公布的效果进行比较。为了摒除与老板法式联系的问题,这些数字是基于复返任何类型雇员的任何老板,这阐扬了非农民老板的一些运行I-CeM逾额诡计。然则,主要特征是一些分部自大出首要相反,大多数分部自大一些数据缺失。总体而言,与GRO阐发比较,I-CeM中悉数阑珊约23,000名非农民和40,000名农民老板。
这个数字太大了,而且显着不是当场散播的,不成用转录或键入舛讹来阐扬。更令东说念主担忧的是,赤字主要蚁集在西北地区(兰开夏郡和柴郡)和伦敦地区,这些地区东说念主口最多,领有全英国好多(要是不是大多数)大型老板。对这些差距的阐扬似乎是,FMP在1851年东说念主口普查中使用的各式贵府开始在不同的转录水平上弘扬了作用。1851年FMP的手本有两个开始:(一)眷属历史学会现存手本,为家支主意抄录,在主要处事被拿获后正常罢手抄录,遗漏了列出雇员号码的膺惩部分;和(ii) FMP我方的转录。
关于FMP我方的转录来说,似乎存在多种残障:一些区域被王人备遗漏,一些个东说念主的行被截断,因为它们从未被王人备键入(与眷属历史协会的形态换取),一些数据在it系统之间飞动数据库的某个阶段被截断和丢失,处事文本串在100个字符处被截断。为了进一步探查I-CeM的不及,自大了1851年和1881年按登记分区(RSD)别离的老板在东说念主口中所占的百分比。对其他早期东说念主口普查年份的分析标明,总体而言,老板约占总东说念主口的0.8%至0.9%,天然有几个地区信得过有0.1%至0.5%的老板,如南威尔士、伦敦东部部分地区和东北部部分地区,如1881年所示图1这些地区是例外。
因此,咱们瞻望,在大多数场地,老板将至少占东说念主口的0.5%,因此,如1851年所示的地区因为低于这个水平可能是不完整的。应该指出的是,此外,相对法式偏差是有余大的单元,在职何情况下都应该有一些老板在场,这意味着相对法式偏差中莫得老板细目是可疑的。在1851年I-CeM数据中描画了与1881年比较的大片区域,在1881年,莫得或独一很少的老板,值得珍贵的是。这些区域的散播稳当苏塞克斯、诺福克、拉德诺郡、兰开夏郡和柴郡的县界。这显着指向一个转录的问题,畸形是因为眷属史协会正常在这些地舆界限内运作。通过搜检CEB的原始记载对受影响地区进行更仔细的搜检标明,在简直通盘这些情况下,处事字符串只包含老板的处事,而劳能源莫得被转录。
在1861年英格兰和威尔士I-CeM数据以及1851-1881年苏格兰东说念主口普查中发现了近似但不同的截断问题。在这些年里,处事字符串连过飞动数据库被截断,通盘字符串被截断,最多50个字符。由于这种截断也出当今FMP汇注界面上,因此它一定是在传输到I-CeM之前的某个时间点发生的。这组成了一个主要问题,因为老板字符串频频比非老板字符串更长,在某个点堵截它们会遗漏通盘或部分王法的劳能源。这一分析标明,I-CeM数据关于任何企业鸿沟分析都是不无缺的。
在1851年英格兰和威尔士的东说念主口普查中,约莫240,000名老板中有跨越60,000东说念主失散;1861年,英格兰和威尔士的大都老板失散或劳能源不完整,一些老板在通盘苏格兰东说念主口普查中失散。此外,1871年英格兰和威尔士不包含在I-CeM的一说念。因此,BBCE的建筑是为了补充I-CeM,并处分其中的每一个问题,以创建1851年至1881年间通盘英国老板的近乎完整的资源。
BBCE从1851年到1911年的东说念主口普查数据中提供了英国企业家精神的完整秘密面。关于1851年至1881年东说念主口普查中可用的老板和劳能源数据,它提供了I-CeM的增强版块,该版块与存储的I-CeM王人备兼容,允许扣问东说念主员识别其职工的完整老板记载。BBCE还包含1891-1911年的改造记载,对无反映和分派不当偏差进行了稳当加权;它还使用数据丰富来识别普查中的公司董事。关于本文的重心,BBCE数据库包含I-CeM中莫得的1851年英格兰和威尔士53,000名老板、1861年28,000名老板和1871年通盘老板的稀奇数据;以及苏格兰6500名老板,涵盖1851年至1881年。这种补凑数据秘密是分几个阶段罢了的。
通盘莫得老板的地区被判定为简直细目被截断,老板少于0.1%的地区被判定为很可能被截断,老板在0.1%至0.3%的地区被判定为可能被截断。老板比例为0.3%至0.5%的地区亦然截断的候选地区,并袭取搜检。行运的是,除了FMP,还有好多其他家支供应商提供东说念主口普查的手本。一个正常使用的替代品,先人,也莫得完整的处事字符串。但是赤字不错通过使用S&N家支供应(S&N)来弥补。S&N对源自原始CEBs缩微胶片的通盘普查进行了王人备安祥的转录,这简直涵盖了FMP和I-CeM中的通盘残障。
这些算法悉数从S&N的数据中识别出75,000札记载。然后,在个东说念主层面将S&N和I-CeM记载进行相互比较。这照旧过远非简单,因为S&N的教区和其他标志符与I-CeM中的不同,因此必须部署大都资源以确保准确匹配。天然多达80%的记载不错通过自动匹配连络起来,但这些记载仍然需要东说念主工搜检,而其余的记载则需要在个东说念主层面进行东说念主工匹配。还有其他几个复杂成分。在S&N阐述的大多数个东说念主记载在I-CeM中都有对应的记载。然则,S&N约有1570份记载与I-CeM中的记载王人备不匹配。
这要么是因为转录或其他键入舛讹,闭塞了匹配的个东说念主被发现(约450例),要么是因为王人备遗漏的教区,正常是成批的(约1120例)。这些莫得可识别的I-CeM副本的S&N记载被手动添加到BBCE数据库,编码为与I-CeM换取的体式,但给出了稀奇的RecIDs。违反,在I-CeM中有一些老板条款中有残障的区域的记载,在S&N中莫得对应的条款。这些I-CeM记载保留在BBCE数据库中。在I-CeM已经包含完整的字符串,而况S&N匹配是转录中有细微相反的重迭的情况下,保留I-CeM转录以保捏更大的一致性。这一填充的效果是增多了53 000份个东说念主老板记载,不然这些记载将会缺失或被截断,其中30 000东说念主是农民。
这约莫占本年可阐述的老板总额的25%。1861年英格兰和威尔士东说念主口普查截断以及苏格兰的通盘年份都需要手动数据输入来完成基于原始CEBs的扫描图像的字符串,这需要大都资源。搜检I-CeM,把柄字符串长度跨越50个字符、以“###”扫尾的字符串(这是数据传输时间截断的要道策划)或字符串中“…”的存在(这是部分未被转录的主要策划),识别通盘可能被截断的字符串。通过这些体式识别出约35,000个截断字符串,并添加了东说念主工蜕变,其中28,000个是老板。这约莫是本年老板记载的20%。
尽管I-CeM存在截断问题,但这一体式应确保罢了尽可能全面秘密普查记载的标的。苏格兰也进行了近似的操作,1851字符串被截断为100个字符,1861和1871字符串被截断为60个字符,1881字符串被截断为80个字符。通盘以这些截断数字或截断数字-1(筹商到空格)扫尾的字符串都与CEB图像进行了东说念主工查对,共完成了近8000个字符串,其中84%是老板。关于1871年的英格兰和威尔士,I-CeM中莫得可用的处事字符串,因为它们从未被FMP转录。本年,索求算法凯旋行使于S&N数据,然后以与1851年数据换取的形态进行算帐妥协析。
这些搜索产生了跨越300,000札记载,然后对这些记载进行认知和算帐,最终获取了包含近140,000名老板的数据集。这项探询涵盖了1871年的老板,与1851-1881年英格兰和威尔士的其他东说念主口普查同样。在对I-CeM进行补充后,BBCE索求的数据不错再次与公布的记载进行比较,这将更好地测试现存的数字记载在多猛进度上复制了GRO表格。鄙人面的分析中,咱们尽可能地复制了GRO的编码体式。如前所述,在非农民表格中谁被当作老板的问题上存在畸形大的朦拢性:他们是否只诡计了明确称为“主东说念主”的老板,正如他们在表格标题中所宣称的那样,照旧他们也包括其他非农民老板,正如他们似乎把柄表格的脚注所作念的那样。
#热门引擎权谋#欧洲杯2024官网