主页 » 正文

什么是施引文献?

admin 2024-06-15 16:43:20 97 °C

一、什么是施引文献?

被引文献参考文献中的内容可能不在论文中出现,但对撰写论文有过帮助。被引文献则是有原文内容出现在论文正文中。

施引文献是引用目的文献的文献。被引文献是研究的知识基础。施引文献是被引文献的发展,可以大致称为研究的前沿。

在引文方面CiteSpace做出的是文献共被引,用到的是参考文献,本质是参考文献的共现关系,然后根据这种关系去聚类,得到一个个簇,分为不同的研究主题。

在此过程中没有直接涉及到施引文献,当然施引文献也有可能作为别的文献的参考文献,但是总有一部分最新的施引文献没有考虑进去,所以这也是文献共被引的一个缺陷,只有当引用发生并且频次达到一定程度时,才能被纳入分析结果内,显然这需要时间的积累。

“被引频次总计”是指此字段显示检索结果集中所有项目的总被引频次(引用参考文献)。这是将“引文报告”表中“合计”栏所显示的所有年份施引文献总数全部相加后的总和。“被引频次计数”是指检索结果和全记录页面计数。

如果用户机构的订阅不包括所有年份和所有引文索引,则在施引文献页面可以查看的施引文献数量可能小于“检索结果”页面和“全记录”页面上“被引频次”计数中列出的数量。

二、聚类分析和因子分析的区别?

我先抛砖引玉。聚类分析的方法经常被用来进行市场细分或用户分群。在聚类分析中,聚类变量的增加意味着需要更大的样本量才能识别出一定的模式。

许多变量(多维度空间)和很少的样本(这个空间只有很少的数据点)(密度不够)通常难以识别出一定的结构。

因此,当聚类变量很多时,很多研究者先进行因子分析萃取出少量因子,然后再利用这些因子进行聚类分析。

直到现在,你都能找到很多使用这种方法的研究文献。

但是,这种方法开始引起一些研究者的质疑。在2011年一篇名为《Three good reasons NOT to use factor-cluster segmentation》的文章中,研究者提出了三条理由说明先因子分析后聚类分析不如直接聚类:

1. 这些萃取出的公因子只能解释部分变异(这个做过因子分析的人都知道),这会丢失一些重要信息;

2.因子是对原始题项的抽象,没有直接的实践意义,甚至会出现一个因子下的题目逻辑上没有关联的情况;

3. 研究者做了一些数据研究发现,对原始题目进行聚类分析比先因子分析再聚类分析更能识别出正确的数据结构。总之,直接聚类分析的方法实际上是更可靠的。

另外还有一个值得提醒的问题就是,正如一开始提到的,参与聚类的变量数越多,所需样本量就越大。

如果直接拿变量进行聚类,常常要考虑自己的样本量是否足够的问题。

很少有研究者提到变量数和样本量之间的数量关系。

不过,Anton Formann在他1984年的一本书中指出最少样本量应该是2^k,其中k代表作为分群基础的变量数。

这意味着,10个变量至少需要1024个样本(2^10=1024)。20个变量算出来的最少样本量那就是天文数字了。如果直接聚类,建议先删去冗余变量再进行。

三、中国知网检索中通过哪些途径获得经典文献?

可以通过大数据分析聚类分析。一般是通过每篇文献的后面的参考文献。

四、kmeans聚类标签怎么打?

① 在 K-means 算法中 K 是事先给定的,这个 K 值的选定是非常难以估计的。很多时候,事先并不知道给定的数据集应该分成多少个类别才最合适。

这也是 K-means 算法的一个不足。

有的算法是通过类的自动合并和分裂,得到较为合理的类型数目 K,例如 ISODATA 算法。关于 K-means 算法中聚类数目K 值的确定在文献中,是根据方差分析理论,应用混合 F统计量来确定最佳分类数,并应用了模糊划分熵来验证最佳分类数的正确性。

在文献中,使用了一种结合全协方差矩阵的 RPCL 算法,并逐步删除那些只包含少量训练数据的类。

而文献中使用的是一种称为次胜者受罚的竞争学习规则,来自动决定类的适当数目。

它的思想是:对每个输入而言,不仅竞争获胜单元的权值被修正以适应输入值,而且对次胜单元采用惩罚的方法使之远离输入值。

② 在 K-means 算法中,首先需要根据初始聚类中心来确定一个初始划分,然后对初始划分进行优化。

这个初始聚类中心的选择对聚类结果有较大的影响,一旦初始值选择的不好,可能无法得到有效的聚类结果,这也成为 K-means算法的一个主要问题。对于该问题的解决,许多算法采用遗传算法(GA),例如文献 中采用遗传算法(GA)进行初始化,以内部聚类准则作为评价指标。

③ 从 K-means 算法框架可以看出,该算法需要不断地进行样本分类调整,不断地计算调整后的新的聚类中心,因此当数据量非常大时,算法的时间开销是非常大的。所以需要对算法的时间复杂度进行分析、改进,提高算法应用范围。

在文献中从该算法的时间复杂度进行分析考虑,通过一定的相似性准则来去掉聚类中心的侯选集。

而在文献中,使用的 K-means 算法是对样本数据进行聚类,无论是初始点的选择还是一次迭代完成时对数据的调整,都是建立在随机选取的样本数据的基础之上,这样可以提高算法的收敛速度。

版权声明:部分内容由互联网用户自发贡献,如有侵权/违规,请联系删除
本平台仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。

本文链接地址:/jqxx/106909.html

相关文章

平安保险公司ai面试是什

一、平安保险公司ai面试是什么? 平安保险公司AI面试是指平安保险公司在招聘过程中,采用人工智能技术对应聘者进行面试的方式。 这种面试方式主要通过语音识别、自然语言理解和

机器学习 2024-06-15 197 °C

学电子商务买什么样的电

一、学电子商务买什么样的电脑好? 学习电子商务对,这个专业对电脑的配置要求不高,可上网的电脑均可满足学习需要。因此可以根据自己的喜好和经济状况随意购买。以下对电脑配

机器学习 2024-06-15 133 °C

机器人班能学些什么?

一、机器人班能学些什么? 机器人班通常是指教授机器人相关知识和技能的课程,包括但不限于以下内容: 1. 机器人基础知识:机器人的定义、分类、结构、工作原理等基础概念。

机器学习 2024-06-14 271 °C

auc值是什么?

一、auc值是什么? auc被定义为ROC曲线下的面积。往往使用auc值作为模型的评价标准是因为很多时候ROC曲线并不能清晰的说明哪个分类器的效果更好,而作为一个数值,对应AUC更大的分类

机器学习 2024-06-14 280 °C

车辆名称中的“GT”是什

一、车辆名称中的“GT”是什么意思啊? GT:英文翻译为Grand Tourer,Grand的意思是豪华,而Tourer的意思是旅行者、巡游者的意思。Grand Tourer加在一起,其实是解作豪华旅行车。远在欧洲尚

机器学习 2024-06-13 189 °C

人工智能为什么要训练?

人工智能需要训练是因为它需要学习和理解大量的数据,以便能够做出准确的预测和决策。训练是人工智能发展的重要环节,它可以帮助人工智能系统学习如何识别模式、提取信息和做

机器学习 2024-06-13 268 °C

监督的再监督是什么意思

一、监督的再监督是什么意思? 监督的再监督是指将已有的人工监督式学习方法与自动化监督学习技术结合,增加其表现能力的一种监督学习技术。 它利用自动化技术来改进人工监督

机器学习 2024-06-12 242 °C

多模态模型是什么意思?

一、多模态模型是什么意思? 多模态模型是指同时利用多种类型的数据(比如文本、图像、语音等)进行建模或者学习的模型。它可以综合不同类型的数据信息,提高模型的性能和表现

机器学习 2024-06-12 85 °C

学UG用什么显卡好?

一、学UG用什么显卡好? 谢邀,首先纠正一个问题,这些软件是做机械设计的,跟工业设计应该区别开! 笔记本配置建议: 1.内存最少8g,越大越好 2.cpu i5以上,主频不要太低,线程越多

机器学习 2024-06-11 131 °C

chatgpt用的什么芯片?

一、chatgpt用的什么芯片? chatgpt用的英伟达的a50芯片 OpenAI的ChatGPT模型是基于芯片(特别是GPU)实现的,所以芯片价格的变动可能会对ChatGPT的成本产生影响。随着人工智能和机器学习的

机器学习 2024-06-10 282 °C