书城政治创新与发展
8603500000016

第16章 信息服务业的空间分布、区位策略与集聚(2)

由此可见,邻近同行业企业或其他相关企业对于企业间的交流与合作是至关重要的,特别是高科技中小企业在信息、技术、人才、资金等方面都比较薄弱,邻近相关企业是其获得知识溢出、选择合作伙伴的重要考虑因素,这种企业创新活动的区域集中度较高。根据上述文献回顾及分析,提出以下假设:

假设5:邻近同行业代表性企业是福建省信息服务企业集聚的重要区位因子。

假设6:向企业众多的开发区集中,成为福建省信息服务企业集聚的重要动因。

三、研究设计

(一)空间尺度

空间尺度较大的研究中,城市只能表现为一个点,表达与之相关的属性是相当有限的。在较大空间尺度上,如针对城市或者某个区域,其内部发展并非同质,全局上的衡量往往掩盖了空间内部的差异(Fotheringham,1997,1999)。当比例尺增大到一定程度,也就是空间单元足够小时,所能揭示的内容、属性会越来越丰富。近年来,国内外越来越多的学者开始采用更小的地理单元研究集聚。例如,Rosenthal、Strange(2003)[i]验证集聚经济效应的研究中采用了邮政编码区层次的数据;Arzaghi、Henderson(2006)[i]采用的地理单元更小,用纽约市曼哈顿地区每100m×100m的栅格作为空间单元研究曼哈顿的广告代理业集群的空间分布。路江涌、陶志刚(2006)[i]计算了省、市、县和邮政编码区域四个层次中我国2位、3位和4位行业代码制造业的区域集聚系数,研究发现,空间单元越小,区域集聚程度也越小。陈良文等(2008)[i]用街道进行微观尺度的分析,研究北京市经济集聚密度与劳动生产率差异。杨振山、蔡建明等(2009)[i]在邮政分区的水平上分析1949年以来北京市的经济空间发展模式。

空间分析严格受研究区域和空间尺度的影响,邮政编码区是目前可操作的、精确的空间尺度之一。邮政编码区的数据从地理属性上讲,是一种按面域统计的数据,适合于用来表示面域内个体的数量或密度。这种情况下,统计的数值是对整个面域而言,而不是指面域中的某一点、某一位置的数值。如果要统计的要素已经具有面域的编码,只需对数据表进行统计即可,在应用GIS过程中无须通过叠置操作(吴升等,2004)[i]。就本文的研究而言,如果地域单元空间范围较大,不能反映城市内部信息服务业的实际空间特征,无法真实地反映都市内部信息服务业集聚的影响因素,不能对它们进行更细致的分析。因此,本文选择区(县)为空间单元分析都市区信息服务业的空间分布状况;以邮政编码区为空间单元,考察信息服务企业集聚的影响因素及区位选择特性。在空间尺度较小的情况下,可以将信息服务企业的属性信息与其他信息相关联,研究信息服务业集聚的微观机制。

(二)指标设计与数据来源

邮政编码区数据来源于国家邮政局的《中国地址邮政编码大全》,福建省的邮政编码数为1076个。将福建省1076个邮编区分成三个圈层,城市中心区、近郊区和远郊区。城市中心区一般是指人口相对周边集中,经济和商业相对周边发展的市区地带。本文的城市中心区是指城市行政部门所在地或者商业比较发达集中的地带,或者该地带所在的行政区。将城市中心区周边的区域和县级市行政部门所在地等定义为近郊区,其他区域为远郊区。城市中心区用CITY表示,将其所在的邮编区赋值为1,其他区域为0;远郊区所在的邮编区用SUB表示,赋值为1,其他区域为0。CITY、SUB为虚拟变量,也是区位变量。

大学样本来自福建省高校招生信息网,选取的样本包括福建省本科院校及高职院校,总计78所,大学所在区域涉及的邮编区有39个。福建省科研机构数据来源于《福建省电信大黄页2010》。本文选取的科研机构包括自然科学研究机构和社会科学研究机构,共有133所,涉及46个邮编区。

福建省同行业代表性企业数据来源于福建信息产业网站,根据福建省信息化局官网上公布的企业名录,对信息产业发展具有重大影响的企业如冠捷电子、三五互联、榕基软件、派克斯、莱茵科技、新大陆等75家企业作为本文的样本数据,涉及25个邮编区。福建省开发区数据来源于《福建省电信大黄页2010》,剔除掉某些与信息服务业相关性不强的开发区如各个地区的旅游开发区,得到69个样本,所涉及的邮编区有60个。

信息服务企业样本的数据来源于截至2010年底的福建省工商局统计信息。由于《国民经济行业分类》(GB/T4754-2002)中并没有信息服务业,笔者采用信息传输、计算机服务和软件业分类作为信息服务业的分类依据。该行业两位数的分类代码60、61、62分别指电信和其他信息传输服务业、计算机服务业和软件业,这三大类均是本文的研究对象。在电信和其他信息传输服务业中,忽略电信和广播电视传输服务企业,重点分析三位数行业中的互联网信息服务(602)。参照上述行业分类的划分方法,确定了本文研究的主要细分行业为软件服务业、互联网信息服务业、计算机服务业。通过数据补缺、筛选、校对、分类和整理,去掉数据缺失或信息不完整的样本,整理出的福建省信息服务企业样本共5385个,其中计算机服务企业样本3161个、互联网服务企业样本1331个、软件服务企业样本893个。

(三)计数模型的选择

将邮编区的企业个数作为因变量,代表集聚水平的高低。在对企业样本进行统计的过程中,发现有相当多的邮编区没有信息服务企业,取值为零,因此,因变量是离散的。当因变量是离散的整数,即为计数变量并且数值较小,取零的个数多,而解释变量多为定性变量时,应该考虑应用计数模型。在计数模型中应用较广泛的是泊松模型(高铁梅,2009)[i]。如,Wu(1999)[i]采用该模型研究外资企业在广州城市内部区位选择;Figueiredo(2002)[i]用该模型研究美国制造业在县级空间单元的区位选择;张华等(2007)[i]用该模型研究北京外资企业区位选择与通达性的关系。但是,张华等(2007)并未对是否适用泊松模型作进一步的验证。为严谨起见,本文在此对于泊松模型的适用性加以验证。

假设第i个研究单元内观测到的企业数服从参数的泊松分布。泊松分布的特征取决于参数,而取决于一系列的解释变量,这里的解释变量是一系列影响信息服务企业集聚的特征要素

如果因变量的分布不能被假定为泊松分布,那么就要在其他分布假定之下执行准-极大似然估计(QML)。即使分布被错误设定,这些准-极大似然估计量也能产生一个条件均值被正确设定的参数的一致估计,即对于这些QML模型,对一致性的要求是条件均值被正确设定(高铁梅,2009)。因此,笔者使用负二项分布的QML估计来估计参数,对于固定的,可以得到参数β的准-极大似然估计。

四、福建省信息服务业的空间分布状况