excel学习库

excel表格_excel函数公式大全_execl从入门到精通

「译」使用蛋形指数进行高精度性别鉴定


Muhammed Kayadan[1] & Yunus Uzun[2] 文 潘兴军 译

Scientific Reports[3] volume 13, Article number: 504 (2023)

摘要

由于蛋鸡只使用雌性雏鸡,因此通常孵化的雄性雏鸡会被杀死。据估计,每年约有 70 亿只雏鸡在孵化后立即被杀死。除了不道德之外,这种情况还会造成巨大的经济损失。雏鸡的性别鉴定可以在孵化之前或之后进行。当然,在孵化前进行的确定更有利,但预测率相对较低。鸡蛋的形态用形状指数 (SI) 表示,即短直径与长直径的比率。在这项研究中,通过使用形状指数RUSBoost分类器来预测雄性和雌性雏鸡。尽管SI因种蛋类型而异,但雏鸡性别与SI之间存在显著相关性(r = 0.78)。因此,即使分类的准确性不如鸭高,也可以通过利用鸡的SI来估计性别。除SI外,还获得了质量、短轴、长轴、椭圆度、体积、偏心率参数并用于结果。有了这些特征,雌性分类正确率为80%,雄性分类正确率为81%。将模型预测应用于先前研究中的雌性雏鸡孵化概率方程,根据该方程正确分类了71%的估计值。通过这项工作,大约80%的准确预测被做出。在这种情况下,可以避免杀死 56.5 亿只雏鸡。同样,许多鸡蛋也不会被浪费,11.3亿美元的损失是可以避免的。

序言

进行饲养和繁殖活动旨在为快速增长的世界人口提供必要的营养。鸡蛋行业是世界主要行业之一。为了增加鸡蛋产量,进行了育种研究,并继续对鸡进行研究。出于效率考虑,肉鸡和蛋鸡品种选择不同。肉鸡生长迅速,可以在短时间内分割上市。另一方面,蛋鸡不会长得那么快并且在发育时不会很重。种蛋的雄性和雌性数量接近1. 蛋鸡行业中雄性雏鸡的存在是一个主要问题。它们不生产鸡蛋,当它们被养大并出售屠宰时也不盈利。因此,孵化者会选择公雏鸡,并在它们刚刚孵出时使用不同的方法进行不道德的扑杀,例如屠宰、气体扼杀或在无氧环境中扼杀。少数人被染色并在宠物店出售2[4].
假设公雏鸡没有分开,它们在屠宰前会消耗大量的饲料,屠宰后获得的收入将远低于费用。一只公鸡平均每天吃一百克饲料。在拥有 10万鸡的农场中,如果公鸡没有分开,农场将饲养10万只公鸡。仅公鸡的每日饲料量为 1万公斤。考虑到公鸡吃的饲料价格为每公斤1 美元,意味着每天 1万美元饲料钱会花在公鸡身上。另一方面,他们的肉的公斤价格最高为 2 美元,发育成熟达到 2 公斤。假设在 6 个月结束时饲料消耗量没有浪费,将获得 2 美元/公斤 * 2 公斤/只 * 10万只 = 40万美元收入。相比之下,1万美元 * 6 个月 * 30 天/月 = 180万美元费用。在这种情况下,损失了 140万美元。

单位面积的家禽数量对它们的健康和盈利能力具有决定性作用3[5].每平方米应该有 6-7 只鸡4[6]. 10万公鸡需要约15,500m2额外的空间。如果计算出 10万公鸡从所有鸡蛋中孵化而没有浪费,则孵化了10万个鸡蛋。假设一个鸡蛋的平均价格为 0.2 美元,这意味着由于鸡蛋费用而损失了 2万美元。全世界每年有70亿只雄性雏鸡被扑杀2[7].这是14亿美元的损失。除此之外,经济损失还将发生在许多项目上,例如使用额外的孵化器、用于孵化器的额外电能以及工作人员数量。
在孵化场中,性别鉴定者将雏鸡分为雄性和雌性。在鸡蛋行业,因为只有母鸡有用,所以有必要将它们分开。雏鸡的性别可以在三个不同的阶段确定。这些是孵化前、孵化期间和孵化后的性别决定。在这项工作中,使用孵化前的性别测定,因为这是挽救雏鸡或孵化蛋的生命并防止鸡蛋浪费的最有效方法。
在孵化鸡蛋之前,可以非常准确地确定性别,这种方法中最具决定性的衡量标准是鸡蛋形状指数5,6,7,8,9,10.在文献7[8]中,采用无监督回归法检测了300枚白尼克种蛋,并提出了雌性孵化概率。在文献8[9]中,研究了340个北京鸭蛋,发现正相关系数为0.71。在文献9[10]中,检查了103个鸭蛋,准确率为86%。在文献10[11]中,503个鸭蛋采用不同的机器学习算法,准确率为87%。有一些不同的技术,例如使用荧光11,12[12]、拉曼光谱13[13]、蛋形指数8[14]、DNA糖基化酶14[15],以检测雏鸡的性别。除形态学方法外,所有方法都需要复杂、昂贵的工具,并且鸡蛋都是穿孔的。卵内卵子方法仅适用于孵化期间,因此雄性卵子被浪费了。形状指数法可在孵育前适用;因此,雄性卵子可以卖到市场上供日常食用。此外,卵内方法的最早时期是孵化的第九天;因此,仍将使用种蛋,并将淘汰活蛋雏鸡。需要一种适用于行业、可靠、快速加工的鸡品种方法。由于这些原因,工业蛋内选择装置仍未完全适用于家禽业。采用形状指数法的研究主要针对鸭子,但鸭蛋模型由于形态不同,不能应用于鸡蛋。迪克门7[16]建议采用回归分析,而不是分类模型。我们建议对鸡品种进行分类模型,该模型不会伤害鸡蛋并且速度非常快。
在这项研究中,使用卵子的形状指数进行性别测定是首选,因为其他方法既昂贵又难以在连续分析中使用。形状指数(SI)是鸡蛋的短直径与长直径的比值15,16[17].一般来说,形状指数低的鸡蛋是雄性雏鸡,形状指数高的鸡蛋是雌性雏鸡。一般来说,鸡蛋有两种类型,椭圆形和尖形,如图所示。1[18].

图1雌性雏鸡的椭圆形鸡蛋(左)和雄性雏鸡的尖头鸡蛋(右)


形状指数(SI)是鸡蛋的短直径与长直径的比值。使用蛋形指数时,形状指数的标准偏差相当低。(0.03844 毫米,60 个鸡蛋)所以性别鉴别是非常困难的。因此,决定使用不同的方法进行比较。通过这种方式,可以进行可能的性能比较。将获得的结果与孵化雏鸡的性别进行比较,并确定精度最高的方法。

根据所有这些条件,决定了以下方法:

  • 使用监督学习算法进行性别分类。本研究使用了 RUSBoosted。

  • 通过直接测量鸡蛋的短轴和长轴来确定形状指标,并根据阈值进行性别鉴别。


使用MATLAB Image Processing Toolbox指定偏心率(自动SI)和短轴和长轴形状指数(手动SI)在这项研究中,对鸡蛋的形状指数与雏鸡性别之间的关系提出了质疑,并列出了结果。

方法论

该实验是在阿克萨赖大学孵化场根据国家关于用于实验和其他科学目的的动物健康和保护的规定进行的。实验的鸡蛋是从当地的后院家禽养殖场购买的。鸡蛋的形态因鸡的品种而异,在当地的后院农场有一个杂交鸡群。在孵化前拍摄鸡蛋图像。卵被它们的长轴夹住,外倾角对准工具用于最准确地产卵。(Mitutoyo 06,389,100,0.01 mm精度)每个鸡蛋都被赋予一个相同的编号(从0到60),它们的ID号被写在鸡蛋及其相应的孵化托盘小格上,并带有标记。首先,将18天的孵化蛋按数字顺序排列,但是,将最后3天的孵化托盘分成小格以跟踪雏鸡。在监督学习中,鸡蛋和小鸡之间的性别配对至关重要。图2[19]显示了培养盘中的小结构。在托盘分割过程中,由于空气流通,必须使用网状材料。孵化后,雏鸡一周大,根据它们的体型、梳子颜色和羽毛通过目视检查来区分它们。

图2分体式培养盘结构


用Diheng THR219 0.01-g灵敏刻度缩放质量并记录。对于物理测量,短轴 |CD|,长轴 |AB|,最大点 |AE|(在凹凸不平的一侧(C 点)接触卡钳的地方)使用 0.01 毫米灵敏的数字卡钳测量。在以前的研究中,使用形状指数 (SI)7,8,16[20].形状指数是短轴与长轴的比值,如图所示。3[21]

图3鸡蛋的对齐。圆角部分 (A)、尖头部分 (B)、最大宽度点(CD)、焦点(F1 和 F2)、交叉点 (E


Shape index = Short Axis /Long Axis = |CD|/ |AB| (1)


形状指数可以在 0 和 1 之间变化。0 表示一条线,1 表示一个完美的圆。在本研究中,椭圆度被创建为参数。|CD|图中的线段。3[22] 表示鸡蛋的最大宽度。椭圆度描述为:

Ovality = (Long Axis − Cross Point)/ Long Axis = (|AB|−|AE|)/|AB| (2)


如果鸡蛋是一个完美的椭圆,则将 E 点放在 |AB|直线和椭圆度变为 0.5。


图像文件夹地址已添加到 MATLAB。“.jpg”文件扩展名用于图像。


在高达图像数量的循环中,读取(imread)并将照片大小调整为540-720,以便快速处理读取图像(imresize)。


将3通道RGB图像转换为单通道灰度图像(rgb2gray)。将单通道灰度图像转换为黑白逻辑图像(im2bw),其中白色低于阈值,黑色高于阈值。由于每张图像的阈值不同,因此对阈值进行了研究,并获得了 2 个不同的阈值。第一个是灰色脱粒,第二个是灰色图像的平均值。保存生成的黑白图像以供分析(imwrite)。


利用函数“regionprops”获得黑白图像的长轴、短轴和偏心率值。从短轴和长轴数据(自动形状索引)中获取形状索引。偏心率是椭圆焦点与其长轴长度之间的距离之比,可在方程(3[23])中表示为16,17,18:


Eccentricity=Distance between Fociis/Long Axis=|F1F2|/|AB| (3)


该值介于 0 和 1 之间。(如果椭圆的偏心率,它实际上是一个圆,如果椭圆的偏心率为1,则它是一条线段17,18[24].得到的形状指数、偏心率、短轴和长轴保存在Excel文件“.xlsl”中进行研究(xlswrite)。创建 Excel 文件和基本参数后,创建了一些附加参数以供进一步检查。表面积公式19[25]:


表面积= 4.835 ∗ Mass 0.662 (4)


表面积是使用上述公式获得的。表面积和体积可以从椭圆形的几何形状转换而来。从表面积获取体积的公式19[26]:


体积=(表面积/4.951)1/0.666 (5)


使用公式获得。从质量和体积信息中获得密度:


密度= 质量/体积 (6)


用公式获得。鸡蛋体积的公式不止一个,但使用了最小化鸡蛋密度标准差的公式 (0.000781369)。孵化雌性卵的概率7[27]:


孵化雌性卵的概率= -0.39531+0.01214*SI*100 (7)


所有测量值都保存在 Microsoft Office Excel 2021 Professional 上,并在此平台上执行其他计算。计算60枚雏鸡的质量(m)、长轴(L)、短轴(W)、形状指数(SI)、雌性雏鸡生长概率、表面积(S)、体积(V)、密度(d)、椭圆度值,并计算各参数的最小值、最大值、平均值和标准差值。


由于我们知道雏鸡的真实性别,因此使用了鸡蛋,因此使用了监督分类方法。我们在MATLAB上训练了RUSBoosted树。RUSBoost 树算法是一种从无序训练数据中学习的分类技术。该算法为 SMOTEBoost 提供了一种更简单、更快捷的替代方案,SMOTEBoost 是另一种结合了提升和数据采样的算法20[28].所有变量的相关系数都是用 Matlab corrcoef() 内置函数找到的。利用该函数,得到了系数矩阵和p值矩阵。用于检验观察到的现象之间没有关系的假设的 p 值矩阵。一般结果和信息如表1[29]所示。

表1 MATLAB上RUSBoosted树模型的结果和信息。

共有 8 个模型特征,包括质量、短轴、长轴、卡尺的形状指数、MATLAB 的形状指数、MATLAB 的偏心率和椭圆度。两个 SI 值,因为它们不完全重叠。交叉验证保持为 5,以防止我们有限的数据中出现过拟合。主成分分析(PCA)保持关闭状态。功能及其描述如表 2[30] 所示。

表2 分类特征及其说明

结果与讨论

混淆矩阵是根据使用形状索引从软件获得的结果创建的。混淆矩阵显示每个单元格中的观测值总数。混淆矩阵的行对应于真实类,列对应于预测类。对角线和非对角线像元分别对应于正确和错误分类的观测值。我们预测数据的混淆矩阵如图所示。4[31].



所有类的混淆矩阵。行代表孵化后确定的雏鸡的真实性别,列代表分类的性别。每个季度代表相应的精度。按季度划分,左上:76%的雌性被归类为正确,左下角:24%的雌性被归类为错误,右上:15%的雄性被归类为错误,右下:85%的雄性被归类为正确。
预测后,雌性的准确率为80%,雄性的准确率为81%。在对鸭子的研究中9[32],在我们的研究中发现,雄性比雌性具有更高的孵化概率。
在预测方面,如果我们的模型估计一个卵子是雄性,那么它的准确率为85%,如果它预测为雌性,它的准确率为76%。这意味着,如果我们的模型一个卵子是雄性的,另一个是雌性的,那么它们就不是同样可信的。低形状指数值意味着包含雌性雏鸡的概率非常低,但如果我们有一个高形状指数的鸡蛋,它可以包含相对更高的概率的雄性鸡蛋。
在孵化期结束时,从 60 个鸡蛋中孵化出 47 只雏鸡。未孵化的卵中有8个未受精,其中5个是死壳的,这是用验蛋法确定的。所有未孵化的鸡蛋都被排除在评估之外。为活着的四十七只小鸡进行了性别鉴别。雌性、雄性和未孵化卵见表3[33]

表3 种蛋和孵化数量

ROC 曲线显示了模型的真阳性率 (TPR) 与假阳性率 (FPR) 之间的关系。TPR 是分类器对“正”观测值预测“正”的速率。FPR 是分类器对实际上为“负”的观测值预测“正”的速率。完美的分类器的 TPR 为 1,FPR 为 0。这种分析主要用于二元分类。在我们的研究中,二元类是雄性和雌性。雄性的ROC分析图如图所示。5[34]a和对于雌性,如图5所示。5[35]b. 曲线下面积 (AUC) 计算在图形中具有重要意义。

图5


图5雄性 (a) 类和雌性 (b) 类的 ROC 分析。


平行坐标图 (PCP) 非常适合将许多变量放在一起进行比较并查看它们之间的关系。这种类型的可视化用于绘制多变量数值数据。
6[36] 显示了已处理特征的 PCP 图形及其分布图。功能说明如表 2[37] 所示。如表所示,质量和长轴的范围最广。自动偏心率和自动 SI 之间的交叉是意料之中的,我们知道低 SI 对应于高偏心率的定义。

图6平行坐标图显示变量之间的关系。所有要素均已规范化
质量与长轴的关系如图所示。如图7[38]所示,参数之间存在正相关关系。这一结果是先前研究所期望的7,8,9,15,16,19.交叉点对应于不正确的预测。具有较长轴值的鸡蛋,因此更大,应该具有更高的质量。如果卵子的质量相同,但长轴较短,则表示短轴较高,这意味着形状指数较高,并且被预测为更有可能是雌性。空头和多头指数之间的关系如图所示。8[39].

图7质量与长轴之间的相关性 (r = 0.76)

图8短径指数和长径指数之间的关系。(r = 0.45)

我们可以在图中看到一些组。8[40]、可能由不同品种的鸡引起。很明显,存在正相关关系,但比率非常低。

结论

在这项研究中,总共使用了 60 个鸡蛋,其中只有 47 个被孵化。这个数字相对较低,需要大量数据才能获得更好的结果。从当地农场随机选择鸡蛋作为鸡的品种和年龄,如果在未来的研究中使用特定的品种和年龄,它可能会产生更好的结果。鸡蛋的形状可能因鸡的品种而异。在蛋鸡生长过程中,鸡蛋的质量增加,但是,这种生长并不均匀。随着母鸡年龄的增长,它的鸡蛋向短轴而不是长轴增大,这直接改变了形状指数。
估计值的平均值(0.5017)被视为阈值。低于阈值的估计值被视为雄性,高于阈值的估计值被视为雌性。47 只雏鸡中有 37 只 (0.787) 被正确分类。
80.85% 意味着我们可以在70亿只被杀死的雄性雏鸡中拯救 56.5 亿只。这除了挽救雏鸡的生命外,还意味着平均利润为20美分21[41]按每年 11.3 亿美元计算。
通过演绎法,拍摄大量卵子的图像并孵化。根据从孵化中获得的性别值对卵图像进行编号,对卵图像进行分类并提供给网络进行训练,然后对网络进行训练。然而,这种方法需要大量的孵化蛋、足够的测量人员和大型孵化器。在这项研究中,确定形状指数与性别之间存在高度相关性。在下一阶段,计划将设计转变为机器,并将极有可能是雌性的卵子分开。

数据可用性

数据可应通讯作者的要求提供。

引用

  1. Ligon, J. D. & Ligon, S. H. 绿色林戴胜孵化时的雌性偏向性别比例。奥克107(4), 765–771 (1990)。

  2. Krautwald-Junghanns, M. E. 等人。在蛋鸡工业中避免淘汰日龄雄性雏鸡的当前方法,特别是光谱方法。科学97(3), 749–757 (2018).

  3. Krautwald-Junghanns, M.E. & Sirovnik, J.放养密度对商业育肥火鸡行为、健康和生产的影响 - 综述。 Poult. Sci.,63(4), 434–444 (2022).

  4. Sonaiya, E. B. & Swan, S. E. J. 小规模家禽生产(联合国食品农业组织,2004年)。

  5. Scholtyssek, S., Grashorn, M., Vogt, H. & Wegner, R.M. Geflügel, 1987;176-215(Ulmer Verlag,1987年)。

  6. Pike, T. W. & Petrie, M. 鸟类性操纵的潜在机制。 Rev. Biol. Proc. Camb. Philos. Soc.78, 553–574 (2003).

  7. Yılmaz-Dikmen, B. & Dikmen, S.一种对白蛋蛋进行性别鉴定的形态测量方法。 J. 家禽科学15(3), 169–286 (2013).

  8. Indarsih, B., Tamzil, M. H., Kisworo, D. & Aprilianti, Y. Pekinducks 孵化后雏鸡性别测定的蛋形指数:印度尼西亚龙目岛小农鸭养殖的解决方案。 Res. Rural. 开发33(4), 1–6 (2021).

  9. Mappatao, G. 使用图像处理通过偏心率测定鸭蛋性别。JTEC10(1-9), 71-75 (2018).

  10. Dioses, L.J., Medina, R., 菲律宾本土鸭蛋性别分类模型的性能, ICSGRC 2021, (2021)

  11. Sohn, S. H., Cho, E. J. & Kang, B. S. 使用羽毛卵泡细胞中的W特异性DNA探针通过荧光原位杂交对新孵化的雏鸡进行性别鉴定。J·保尔特(J. Poult.) 科学49(4), 231–236 (2012).

  12. Galli, R. 等人。通过壳膜的荧光和拉曼光谱对鸡蛋进行性别鉴定。公共科学图书馆一号13(2),1-14(2018)。

  13. Galli, R. 等人。非接触式鸡蛋的卵性别测定。 Dir. Biomed. Eng.3(2), 131–134 (2017).

  14. Porat, N. 等人。直接检测鸡基因组 DNA,通过胸腺嘧啶-DNA 糖基化酶确定性别。 Poult. 科学52(1), 58–65 (2011).

  15. Narushin, V. G. & Romanov, M. N. 鸡蛋的物理特性和孵化能力。世界科学杂志58(3), 297–303 (2002).

  16. 西山,蛋形的母体学。Int. J. 纯应用数学78(5), 679–689 (2012).

  17. 哈姆丹,马萨诸塞州,阿尔卡迪,ZA和Subaih,BM一种使用 Matlab 分析数字图像中对象的方法。IJCSMC5(11), 21–28 (2016).

  18. 阿亚拉,和洛佩斯-迪亚斯,M.单纯形色散有序及其在人角膜内皮评估中的应用.J. Multivar. 肛门。100(7), 1447–1464 (2009).

  19. Paganelli, C. V., Olszowka, A. & Ar, A.禽蛋:表面积、体积和密度。秃鹰76(3), 319–325 (1974)。

  20. Seiffert, C., Khoshgoftaar, T. M., Hulse, J. V. & Napolitano, A. RUSBoost:缓解阶级失衡的混合方法。IEEE Trans. Syst. Man Cybern.一个系统的嗡嗡声。40(1), 185–197 (2010).

  21. 生活成本。一打鸡蛋的平均价格。https://www.nationmaster.com/country-info/stats/Cost-of-living/Prices-at-markets/Egg/Dozen。(2022).

作者信息

作者和单位

  1. 阿克萨赖大学电气与电子工程系,土耳其阿克萨赖

穆罕默德·卡亚丹(Muhammed Kayadan)和尤努斯·乌尊(Yunus Uzun)

贡献

M.K.已经准备好了实验系统和设备。他进行了分析和模拟。Y.U.做了实验并写了论文。这些数字和表格由M.K.和Y.U.编制。所有作者都审阅了手稿。

通讯作者

尤努斯·乌尊(Yunus Uzun[42])的通信。


发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

«    2024年12月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
    文章归档
      友情链接