2020年度精选TOP研究推荐

  • 发布时间:2021-02-20
  • |
  • 作者:SpringerNature Springer 2021-02-20
  • |
  • 阅读次数:66

引言

无论从何种角度看,2020注定都是不平凡的一年。尽管如此,纵观2020全年,科研工作者们依然出版了很多优秀的研究。我们特别精选2020年统计学领域TOP研究高引用期刊文章和高下载图书章节。希望这些内容可以对您有所助益,轻松助力您的下一个研究!Springer Nature 将持续为科研工作者们提供更多优质的期刊、专著、教科书和参考著作。

图片

欢迎扫码浏览【2020年度精选TOP研究推荐 | 统计学】专题主页全部内容


精选期刊文章

A simple method for implementing Monte Carlo tests | 实现蒙特卡洛模拟的简单方法

from Computational Statistics

图片




图片

扫码阅读全文

摘要:在本文中,我们提出了一个 p 值只能使用蒙特卡洛模拟近似的统计测试。我们对观测数据集的 p 值是否高于或低于给定阈值(例如 5%)很感兴趣。为此,我们需要确保重采样风险,即(蒙特卡洛模拟)决策与真实决策不同,是统一的。本文介绍了一种具有这一属性的简单开放式方法——置信序列法(CSM)。


我们将 CSM 与同样能够在重采样风险上确保(渐进)一致有界的SIMCTEST 算法,以及其他没有一致有界的蒙特卡洛模拟算法进行了比较。比较结果显示,CSM 没有调谐参数,相对比较保守,它与 SIMCTEST 不仅来自同样的理论,在许多情况下也拥有相似的停止边界。因为 CSM 相较其他方法简单得多,所以非常实用。


Ensemble of optimal trees, random forest and random projection ensemble classification | 最优树集成、随机森林及随机投影集成分类

from  Advances in Data Analysis and Classification

图片




图片

扫码阅读全文

摘要:随机森林集合的预测性能与单个树的强度、多样性密切相关。在不影响预测精确度的情况下,选择少量精确且多样化的树进行集成,也会减少计算负担。我们对如何能够整合精确且多样化树的问题进行了研究。为此,我们利用袋外观测作为训练 bootstrap 样本的验证样本,根据个体表现选择最佳树,接着使用独立验证样本上的 Brier 评分对这些树的多样性进行评估。从第一个最佳树开始,我们只添加能够减少已添加树错误的树到林中,这种方法不会使用隐式降维对树进行随机投影组合分类。我们通过 35个分类和回归的基准问题评估了这一方法的性能,并将其与随机森林、随机投影组合、节点收获、支持向量机、kNN、分类回归树进行了比较,并对相应数据集上所有方法无法解释的方差或分类错误率进行了计算。实验结果表明,在大多数情况下,本方法都能有效缩小集成并获得更好的结果。除此之外,我们还给出了模拟研究结果。在模拟研究中,我们探讨了使用四种不同的树生成具有多个结构数据集的方法。


Mean and median bias reduction in generalized linear models | 广义线性模型中减少均值及中位数偏差

from Statistics and Computing

图片




图片

扫码阅读全文

摘要:本文提出了一个综合框架,希望利用调整后的分数方程对广义线性模型进行估算和推理,从而减少均值及中位数偏差。该框架将以往研究均值偏差减少的理论及方法论进行了统一,并自然地适应了减少中位数偏差研究的新进展。调整后分数函数的一般表达式是根据标准软件中用于拟合广义线性模型的数量推导出来的。使用统一拟费舍尔评分算法求解所得的预测方程,该算法显示为具有经过适当调整工作变量的迭代加权最小二乘方,建立了减少均值及中位数偏差的迭代之间的联系。当需要估计弥散参数时,核心模型不变性可用于开发一种全新的混合调整策略。除此之外,这一算法展示了如何使用等效泊松对数线性模型减少多项式逻辑回归中的中位数偏差。从减少均值及中位数偏差得出的估算可以解决与无限估计相关的实际问题,这些问题可能在具有多项式或离散响应的广义线性模型中以正概率发生,即便存在高维滋扰参数的情况下也能够得出有效推论。


Inference and computation with generalized additive models and their extensions | 广义加性模型及其拓展的推理与计算

from TEST

图片




图片

扫码阅读全文

摘要:得益于其灵活性与可解释性之间的良好平衡,响应变量与某些预测变量的平滑函数相关回归模型得到了广泛应用。自 Hastie 与 Tibshirani 有关广义加性模型的著作(广义加性模型,Chapman & Hall,Boca Raton,1990)出版,大量的模型拓展被提出,出现了各种实用的计算方法。本文概述了一些广泛适用于这类建模的框架,强调了不同建模方法之间的相似性以及平滑等效性(例如:高斯潜在过程模型及高斯随机效应)。文章重点为贝叶斯平滑理论,通过随机模拟或集成嵌套拉普拉斯近似及提升展示了完整的贝叶斯理论。


On the problems of sequential statistical inference for Wiener processes with delayed observations | 关于具有延迟观测特点维纳过程的顺序统计推断问题

from Statistical Papers

图片




图片

扫码阅读全文

摘要:我们研究了在(恒定)延迟检测时间下,可观察的维纳过程具有线性延迟惩罚成本的顺序假设实验,以及最快变化点(或无序)检测问题。证明方法包括将一维扩散过程的相关延迟优化停止问题简化为等效的自由边界问题,并借助光滑拟合条件解决后者。在原始顺序分析问题中,我们推导出了贝叶斯风险函数的闭合形式表达式,并得到了相关加权可能性比率过程的最佳停止边界。


精选图书章节

An Introduction to Sequential Monte Carlo

图片




图片

扫码阅读推荐章节

推荐章节: Introduction to State-Space Models | 状态空间模型简介


摘要:状态空间模型的顺序分析至今仍是序列蒙特卡洛方法的主要应用。本章的目的是定义非正式的状态空间模型,并讨论不同科学领域使用此类模型的几个经典案例。但是,我们需要告知读者,我们需要在以下各章中学习的数学知识来定义足够通用的状态空间模型,开发滤波器和平滑器的递归,并设计包括粒子滤波器在内的各种仿真算法。


Official Statistics 4.0

图片




图片

扫码阅读推荐章节

推荐章节:Official Statistics 4.0: The Era of Digitisation and Globalisation | 官方统计 4.0:数字化及全球化的时代


摘要:未来无法预测,而统计学家们通常会通过此前发生的事情对未来进行预判。然而,仍有一些具体影响不明的,人们必须适应的趋势或大趋势即将发生。由于官方只能缓慢的调整统计数据的方向和速度,我们必须以前瞻性的眼光对所有的趋势进行解释。如果要将五年内的官方统计数据维持目前水平,那么现在就必须制定必要的战略。因此,简单延续此前策略,并进行微小调整的方案不再可行。本章介绍了数字化及全球化两大趋势,方法论、概念与技术并非重点,主要讨论了由统计环境和条件的变化对统计政策造成的影响。


Targeted Learning in Data Science

图片




图片

扫码阅读推荐章节

推荐章节:Research Questions in Data Science | 数据科学中的研究问题



摘要:随着获取新形态数据能力的不断增强,人们在医学、技术和商业领域面临的研究问题复杂性也在不断增加。在观测和实验研究中心,大部分数据都是在较长时间内通过在中间时间点通过多种方法收集的。其中,一些数据以流媒体(例如推特上的帖子)、图像、DNA 序列或电子健康记录等方式存在,我们必须开发更多的统计学习方法,适应这些新挑战。


 Random Forests with R

图片




图片

扫码阅读推荐章节

推荐章节:Random Forests | 随机森林


摘要:随机森林的基本原理是聚合随机决策树的集合。我们的目标并不是立即优化预测器,而是将一组预测器(不一定是最优的)合并在一起。因为单个树会受到随机干扰,森林受益于对所有可能树预测器空间更广泛的探索,因此会在实践中产生更好的预测性能。本章专注于随机森林的讨论。首先,我们会对树的不稳定性进行分析,接着我们会介绍两种随机森林的变体:Bagging思想以及随机森林的随机输入。我们也会使用 randomForest 数据包在垃圾邮件数据集上说明随机森林的构造。除此之外,我们还提出了巧妙预测误差,估计袋外误差的方法。接下来,本章评估了预测性能对树的数量与每个节点上拾取变量数这两个主要参数的敏感性。最后一部分,我们将随机森林应用于三个示例:预测臭氧浓度、分析基因组数据、分析粉尘污染。


 Time Series in Economics and Finance

图片




图片

扫码阅读推荐章节

推荐章节:Methods for Multivariate Time Series | 多元时间序列方法


摘要:前几章中,大多数单变量时间序列过程都可以推广为多元时间序列。其中,代替标量值 yt,我们观察 m变量矢量值yt = (y1t, …, ymt)′的时间作为矢量随机过程的实现(详见课程 2.1)。从单变量向多变量维度的转换主要意味着书中前几章节中描述的方法(分解方法、线性及非线性过程方法等)仅具有较高的形式及数值复杂性,本章将通过固定多元时间序列示例集的方法对此进行简要说明。随后我们会发现,这种对几个标量过程的并行描述为分析带来了只具有多元特征的元素(例如多元时间序列常规方法 VAR、特定单变量成分之间的协整等等)。


 Clinical Prediction Models

图片




图片

扫码阅读推荐章节

推荐章节: Applications of Prediction Models | 预测模型的应用


摘要:在本章中,我们对预测模型在公共卫生、临床实践及医学研究中的应用进行了思考,并通过几个小案例对此进行了说明。


图片


图片

点击“阅读原文”,浏览统计学学科更多精彩内容!

版权声明


本文由施普林格∙自然北京办公室负责编译。中文内容仅供参考,一切内容以英文原版为准。如需转载,请联系 marketingchina@springernature.com


© 2021 Springer, part of Springer Nature. 

All Rights Reserved.

图片