电子信息农业应用论文 [论文总结] 深度学习在农业领域应用论文笔记

小编 2024-10-22 论坛 23 0

[论文总结] 深度学习在农业领域应用论文笔记

文章目录

1. 深度学习1.1 图像分类1. A Neural Network Method for Classification of Sunlit and Shaded Components of Wheat Canopies in the Field Using High-Resolution Hyperspectral Imagery2. Crop pest classification with a genetic algorithm-based weighted ensemble of deep convolutional neural networks3. Data augmentation for automated pest classification in Mango farms4.Data augmentation for automated pest classification in Mango farms5. An attribution-based pruning method for real-time mango detection with YOLO network6. Predicting pasture biomass using a statistical model and machine learning algorithm implemented with remotely sensed imagery7.Irrigation water infiltration modeling using machine learning8. Short term soil moisture forecasts for potato crop farming: A machine learning approach9. Wild blueberry yield prediction using a combination of computer simulation and machine learning algorithms10. Citrus advisory system: A web-based postbloom fruit drop disease alert system11. Automated crop plant counting from very high‑resolution aerial imagery12. EfficientNet-B4-Ranger: A novel method for greenhouse cucumber disease recognition under natural complex environment13.Automatic vegetable disease identification approach using individual lesion features14. Comparison of convolution neural networks for smartphone image based real time classification of citrus leaf disease1.2 语义分割1. Establishing a model to predict the single boll weight of cotton in northern Xinjiang by using high resolution UAV remote sensing data2. Tomato leaf segmentation algorithms for mobile phone applications using deep learning3. Biophysical parameters of coffee crop estimated by UAV RGB images4. Vineyard yield estimation by combining remote sensing, computer vision and artificial neural network techniques5. Accuracy of carrot yield forecasting using proximal hyperspectral and satellite multispectral data6. Evaluation of cotton emergence using UAV-based imagery and deep learning7. Deep learning techniques for automatic butterfly segmentation in ecological images8. Improving segmentation accuracy for ears of winter wheat at flowering stage by semantic segmentation 利用语义分割提高冬小麦穗开花期的分割精度2.3 目标检测1. Brown rice planthopper (Nilaparvata lugens Stal) detection based on deep learning2. Identification of olive fruit, in intensive olive orchards, by means of its morphological structure using convolutional neural networks2. 机器学习1. A random forest ranking approach to predict yield in maize with uav-based vegetation spectral indices3. 其他1. DropLeaf: A precision farming smartphone tool for real-time quantification of pesticide application coverage2. Underutilised crops database for supporting agricultural diversification3. Replacing traditional light measurement with LiDAR based methods in orchards4. A cyber-physical intelligent agent for irrigation scheduling in horticultural crops5. Biophysical parameters of coffee crop estimated by UAV RGB images6. A satellite-based ex post analysis of water management in a blueberry orchard7.A 3D white referencing method for soybean leaves based on fusion of hyperspectral images and 3D point clouds8. Assessing winter wheat foliage disease severity using aerial imageryacquired from small Unmanned Aerial Vehicle (UAV)

1. 深度学习

1.1 图像分类

1. A Neural Network Method for Classification of Sunlit and Shaded Components of Wheat Canopies in the Field Using High-Resolution Hyperspectral Imagery

总结: 这篇论文运用的是图像分类的方法。线性判别分析 (LDA),以找到表征预选类别(阴影叶片(SHL),阴影耳朵(SHE),阳光叶片(SL),阳光耳朵(SE)和背景( BG) 的特征的线性组合。. RGB数据由620 nm(红色),535 nm(绿色)和445 nm(蓝色)三个波段组成。带注释的数据是从不同作物生长阶段的23个小麦品种的高光谱图像中收集的。SL,SE,SHL,SHE和BG的5类注释数据的总数分别为119,447、164,223、11,644、4361和227,232像素(这个地方应该是指照片)。使用了平均准确度(AA),F评分和召回评分,将CNN模型与梯度下降支持向量机分类 进行了比较。 优点 :该研究由实际的拍摄装置,有充分的大田实验和较大的数据集。缺点 :看完这篇论文不知道解决了一个什么样的实际问题。参考价值 :2分。

2. Crop pest classification with a genetic algorithm-based weighted ensemble of deep convolutional neural networks

总结: 在整个研究过程中,七个不同的预先训练的CNN模型(VGG-16, VGG-19, ResNet-50,开端- v3,Xception、MobileNet、SqueezeNet)使用适当的迁移学习和微调策略 ,对40个类的公开D0数据集进行了修改和再培训。随后,通过最大概率和策略对性能最好的三个CNN模型Inception-V3、Xception和MobileNet进行集成以提高分类性能,该模型被命名为SMPEnsemble。然后,利用加权投票的方法对这些模型进行整合。

遗传算法 综合考虑三个CNN模型的成功率和预测稳定性,确定权重,模型命名为GAEnsemble。GAEnsemble在D0数据集上获得了98.81%的最高分类精度。为了增强集成模型的鲁棒性,在不改变D0上初始性能最好的CNN模型的情况下,使用另外两个数据集,即10类的小数据集和102类的IP102数据集重复这个过程。的准确性GAEnsemble的值为95.15%的小数据集和67.13%的IP102。优点 : 不突出,论文很普通。 缺点:数据集小。参考价值: 2分。

3. Data augmentation for automated pest classification in Mango farms

总结 :本文提出了一种先进的机器学习(ML)技术,用于分析大规模芒果田,并使用计算机视觉和深度学习技术识别生物威胁的发生。本文提出的ML技术扩展了预先训练好的VGG-16深度学习模型,用一个两层的全连接网络训练来补充最后一层。此外,本研究也考虑到印尼农民在收集和处理芒果农场的视觉信息时所面临的实际操作条件。有效训练深度学习网络的数据集可用性的稀疏性是通过应用数据增强过程来解决的,该过程能够准确地重现农民所面临的条件。在验证数据集和测试数据集上,本文提出的训练方案的总体准确率分别为73%和76%。应用增广变换函数后,测试数据的精度提高了13.43%。

4.Data augmentation for automated pest classification in Mango farms

总结:芒果虫害分类框架,该框架由15个类别组成,根据对VGG-16网络的改进,划分16类害虫和健康叶片。提出的ML技术扩展了预先训练好的VGG-16深度学习 模型,用一个两层的全连接网络训练来补充最后一层 。有效训练深度学习网络的数据集可用性的稀疏性是通过应用数据增强 过程来解决的,该过程能够准确地重现农民所面临的条件,并实时接收可能影响芒果生产的害虫类别的分类输出。优点 :最后开发了一个基于安卓的APP。缺点 :我不知道。个人感觉没什么亮点,也只有一个网页界面,并没有说开发的APP解决了什么问题。参考价值 :3分。

5. An attribution-based pruning method for real-time mango detection with YOLO network

总结 :该研究提出了一种易于微调的剪枝检测网络广义归因方法检测芒果。通过设计信道和空间掩码来推广归因方法 ,可以检测出原始YOLOv3-tiny 网络中与特定目标输出紧密相关的卷积核。然后,对不相关的核进行逐层的通道维剪枝 。在对修剪后的网络进行微调 之前,采用锚点大小数据增强和学习率衰减 来检测芒果。实验结果表明,得到的网络是一个规模和旋转不变的芒果检测网络,在2.6 GFLOPs (giga-浮点运算)下获得了f1得分0.944。与未进行剪枝的精调网络相比,我们的网络计算量减少了68.7%,而准确率提高了0.4%。

与使用相同mango数据集训练的最先进网络相比,该算法的计算量减少了83.4%精度损失仅2.4% 左右。所提出的剪枝方法可以从大规模检测网络中剥离一个子网,以满足移动设备低功耗处理器的实时性要求,例如ARM Cortex-A8执行约4.0 GFLOPS (giga-浮点运算每秒)。训练过的网络和测试代码可供比较研究**。

优点**:这篇论文是2019年7月就投稿了。提出了微调和剪枝。缺点 : 奇怪的是说是芒果检测,但我没有找到论文中的芒果数据集,也没有大田实验。更像是一篇一般的工学论文想发到农学不错的期刊。参考价值 :2分,和我们做的差不多,但没我们做的好。

6. Predicting pasture biomass using a statistical model and machine learning algorithm implemented with remotely sensed imagery

总结 :本研究的目的是测试一个集成方法的性能结合获得的遥感图像与多光谱相机安装在无人机(UAV),统计模型(GAM全面相加模型)和机器学习算法(随机森林,RF)实现与公开的数据来预测未来的牧草生物量的负载。本研究表明,利用草地生长观测、环境变量和草地管理变量,GAM和RF两种模型均可预测放牧前草地生物量产量,平均误差在20%以下。优点 :该论文有实际的天气数据,施肥数据以及无人机飞行数据。缺点 :只有训练集和测试集。没有用新的方法。参考价值 :2分。

7.Irrigation water infiltration modeling using machine learning

总结:本研究提出了五个标准的人工智能模型包括人工神经网络(ANN) ,自适应神经模糊推理系统(ANFIS) 分组的数据处理方法(GMDH) , 多元线性回归 和**支持向量回归(SVR)以及它们的综合模型结合 萤火虫算法(FA)**预测沟中的渗透水的灌溉系统。在构建综合模型时,FA是一种优化工具。评估这些模型的数据是收集自发表的文献和在伊朗科曼斯布克大学研究农场进行的实地实验。模型的输入参数为沟长(L)、入渗速率(Q)、沟尾提前时间(TL)、入渗横断面面积(Ao)和入渗机会时间(To)。采用均方根(RMSE)、平均绝对误差(MAE)、相关系数(R2)、Nash-Sutcliffe效率指数(NSE)和一致性指数(IA)对模型的预测效果进行评价。

结果表明,FA能够提高模型的精度,在ANFIS、GMDH、MLPNN和SVR中RMSE值分别提高5%、1%、4%和47%。综合综合指数(SI)的计算值表明,SVR和FA的结合显著提高了标准SVR模型的性能达97%。优点 :用了多种模型以及FA算法预测水的灌溉系统。缺点 :没有显示数据集大小。参考价值 :3分。

8. Short term soil moisture forecasts for potato crop farming: A machine learning approach

总结 :这篇论文介绍了使用传感器利用3年的数据,在多种场景下进行了实验。3个土壤深度,每年测10次。和天气变化数据以及参考了其他文献的数据。。优点 :丰富的实验数据。缺点 :相比大数据而言,数据还是少了。用的方法为特征提取,支持向量机以及神经网络。参考价值 :3分。

9. Wild blueberry yield prediction using a combination of computer simulation and machine learning algorithms

总结 :这项研究中,我们使用的数据产生的野生蓝莓传粉模型是一种空间显式的模拟模型 ,通过近30年美国缅因州的野外观测和实验数据验证了该模型(仿真模型 )的有效性。本研究的主要目的是评价蜜蜂种类组成和天气因子在调节野生蓝莓农业生态系统中的相对重要性。具体来说,我们试图揭示蜜蜂种类组成和天气如何影响产量,并预测最佳产量。利用计算机模拟和机器学习算法实现最佳产量的蜜蜂种类组成和天气条件。

多元线性回归(MLR)增强决策树(BDT)随机森林(RF)和极端梯度增强(XGBoost) 作为预测工具进行评估。在向学习算法提交数据之前,我们还进行了预测器选择。这样,我们就可以在不显著降低预测精度的情况下减少输入的维数。结果表明,无性系大小、蜜蜂、大黄蜂、雄蜂种类、雌蜂种类、最高高温范围、降水日数是预测结果的最优变量。结果表明,XGBoost优于其他算法在所有措施模型预测性能的野生蓝莓的收益率达到确定系数(R2) 0.938,均方根误差(RMSE)为343.026,206年的平均绝对误差(MAE)和相对均方根误差的5.444%。优点 :用了的仿真模型。缺点 :方法上没觉得有创新。参考价值 :4分。

10. Citrus advisory system: A web-based postbloom fruit drop disease alert system

总结 :PFD(橘子采后病)可能会导致柑桔花后落果是柑桔的一种严重真菌病,可导致果实过早脱落。该研究开发一个基于网络的工具,以协助柑橘种植者为管理PFD风险的喷雾决策。信息技术如数据库、查询和编程语言已经被用来开发这个工具。该系统从佛罗里达自动天气网络(FAWN)和农业气候研究小组安装的气象站收集天气数据,并使用天气观测运行PFD疾病模型,并估计环境对感染的有利程度。该系统向农民发送通知并根据不同的PFD风险和花期推荐使用杀菌剂。首先描述天气数据源,叶片湿度模型叶片湿度决策算法

最后,我们介绍了如何使用信息技术来提供允许用户轻松访问系统的解决方案。优点 :做了网页界面。该系统目前已在佛罗里达州 使用,但作者的目标是将其地理扩展到美国其他柑橘种植州。缺点 :方法很普通,相当于就是利用气候数据区模拟叶片湿度模型,然后在PFD模型计算时间间隔指数,当分生孢子萌发指数达到一定阈值时,就会促发喷雾,达到预防PDF的目的。参考价值 :4分。我们有天气数据可以做什么预测?

11. Automated crop plant counting from very high‑resolution aerial imagery

总结 :在这项研究中,提出了一种自动方法,用于从超高分辨率无人机图像中对植物进行计数。拟议的方法使用机器视觉-过量绿色指数和大津的方法-并使用卷积神经网络进行转移学习以识别和计数植物。集成方法已被实施,以在表面积为3.2公顷的实验田中对10周龄的菠菜植物进行计数。植物计数的验证数据可用于表面积的1/8。结果表明,所提出的方法论可以在面积达172 m2的区域中以8 mm /像素的空间分辨率对植物进行计数,准确度为95%。此外,当空间分辨率降低50%时,获得的最大附加计数误差为0.7%。最终,在3.5公顷的面积中计算出170,000株植物的总误差为42.5%。

研究表明,使用基于无人机的现成产品对单个植物进行计数是可行的,并且通过机器视觉/学习算法,可以将图像数据转换为非专家的实用信息。优点 :工作做的挺好的。做了很多的大田实验也有实际数据。逻辑合理。缺点 :方法用的是AlexNet和迁移学习,较为一般。参考价值 :3.5分。

12. EfficientNet-B4-Ranger: A novel method for greenhouse cucumber disease recognition under natural complex environment

摘要 :在这项研究中,我们的主要任务是找到一种有效的方法来解决同一叶片中发生的两种疾病和外界光的影响所导致的疾病相似性问题。首先,我们在自然复杂的温室背景下获得了黄瓜叶片疾病数据集,其中不仅包括白粉病,霜霉病,健康叶片,还包括白粉病和霜霉病的组合。其次,我们使用当前最先进的方法EfficientNet为上述四种类型建立分类模型,模型精度为97%,并证明EfficientNet-B4是最适合本研究的方法。最后,我们使用经过最先进的优化程序Ranger改进的E ffi cientNet-B4构建了黄瓜相似疾病的两个分类模型,获得了出乎意料的准确性(96%)。

方法:CNN 。基于上面的相关工作,我们选择EfficientNet模型作为疾病分类研究的方法,并选择当前典型深VGG 等学习方法 ,ResNet, AlexNet, Ierception v4, SqueezeNet, DensenNet 比较模型进行分类研究类似的疾病cu-cumber叶子参与这项研究。

本研究的目的是:1. 探索自然和复杂环境下温室黄瓜病害(主要包括PM、DM、PD和健康叶片)的有效分类方法。2. 利用目前最先进的优化器(Ranger)对目前最先进的EfficientNet模型 进行改进,并将其应用于相似性高的DM和PD黄瓜病的重新认识。3. 探讨植物病害鉴定与分类在未来可能面临的挑战和机遇。数据集来源:一天中拍摄到5000多张的4种类型病虫害样本。通过强化学习将数据集总数增加到了2万张。训练集、验证集、测试集比例为8:1:1.个人总结 : 这篇论文就是采用EfficientNet模型对黄瓜叶片混合虫害进行分类。工作做的可以。结构合理。方法一般。

13.Automatic vegetable disease identification approach using individual lesion features

总结 :本研究提出了一种从单个褪绿和坏死病变中提取局部特征的方法,最大限度地减少特征冗余和向量大小。颜色一致性载体(CCV),一个特征,描绘不同的同质模式相对于疾病进展是从褪绿区域提取。另一方面,从坏死区域提取局部二值模式(LPB)。将这些单个的病变特征连接起来,形成用于疾病识别的病理特征向量,从而使特征大小最小化,并避免处理表面描述符的可能性。为了验证所提方法的有效性,我们使用不同的传统分类器(支持向量机、朴素贝叶斯、KNN )来测试这些特征在精确分类植物病害时的质量和效率。结果表明,该方法在所有案例中均获得了较高的准确率和召回率,召回率超过99%,与其他文献报道的方法相比,准确率有所提高。

AlexNet的最后三个完全连接的层被修剪,并被新的层所取代,这些层将划分为EB、LB和HL三个等级。这样,来自其他层的特征就被保留了,也就是,转移的层权重。然而,新层的权重和偏差增加了10倍,学习速度变快。ResNet与AlexNet迁移学习中应用的过程类似,这一层和输出层都被新的层取代,输出的数量等于疾病类别的数量

然而,在这种情况下,当较早的层的权值被重新初始化时,网络的前十层的权值通过将其学习速率设置为0而被冻结。这加快了网络训练,因为这些层中的梯度不会更新。结论:单个褪绿和坏死疾病区域模式的使用导致产生有效的病理特征描述符,使特征向量长度最小化,并改进了识别结果。此外,在只有4个颜色特征的情况下,SVM分类器能够达到99.33%的整体精度,AUC为0.99。在总共15个特征描述符中,仅使用7个子集也获得了类似的结果。这强烈地强调了将疾病区域定位为褪绿和坏死的重要性,以及CCV的颜色时刻在疾病鉴定中的重要性。

个人总结:方法上没有创新,结构合理,逻辑也合理。参考

14. Comparison of convolution neural networks for smartphone image based real time classification of citrus leaf disease

总结:专家通过使用农业实验室或观察视觉症状帮助农民诊断柑橘疾病。由于专家的费用和没有实验室,这些方法可能不是所有农民都能得到。本研究比较了两种不同的卷积神经网络(CNN)结构来对柑橘叶片的病害进行分类。本文采用两种CNN体系结构,即MobileNet和自结构(Self-Structured, SSCNN)分类器 ,对柑橘植物期叶片病害进行检测和分类。

该研究准备了一个基于柑橘疾病数据集的智能手机图像。两个模型都在同一个柑橘数据集上进行了训练和测试。分别利用训练集和验证集的精度和损失来评估模型的性能。MobileNet CNN的最佳训练精度为98%,在epoch 10的验证精度为92%。但SSCNN在epoch 12的最佳训练精度为98%,验证精度为99%。结果表明,基于智能手机图像的SSCNN算法对柑橘叶片病害分类具有较高的准确率和实用性。此外,与MobileNet相比,SSCNN算法的计算时间更短,可以被认为是一种经济有效的柑橘病害检测方法。

1.2 语义分割

1. Establishing a model to predict the single boll weight of cotton in northern Xinjiang by using high resolution UAV remote sensing data

总结 :利用无人机获取的多时相高分辨率可见光遥感数据,建立了单铃重量预测模型。对新疆昌吉、石河子和沙湾地区29块农田的开花期和铃期遥感数据进行了研究。在每个田间选取5个半径为1 m的圆形区域作为地面调查区,采集棉铃样本。作为模型的因变量,利用全卷积神经网络 对遥感图像进行像素级语义分割 ,提取图像中的棉花段,消除土壤像元对模型精度的影响。相关分析是由结合VDVI (可见频带植被指数) 在开花和结铃阶段,VDVI棉子开放阶段,VDVI吐絮领域(FCN提取)和RGB值,然后使用最小二乘线性回归BP神经网络模型 对上,中间,低棉层计算调查地区平均单铃重。

随后,进行K-fold交叉验证 以评估结果。结果表明,最小二乘线性回归结果(R2 = 0.8162)与BP神经网络(R2 = 0.8170)几乎相等。开花期和结铃期的面积开铃率和VDVI与上部单铃重高度相关。本研究提出了一种实现单铃重大规模预测的方法,为棉花产量预测和育种筛选提供了新的思路。

优点 : 有大田实验和专门的设备。缺点 :数据量不大,工作量也不大。就是用了无人机跑了一周得到的数据。然后用了测定了不同参数与单铃重量的相关系数,确定他们之间的相关性,达到预测产量的目的。参考价值 :3分。,为本研究收集了1408张具有挑战性的叶片图像。由于以下几个原因,本研究获得的结果是新颖的:(1)我们已经证明,准确自动背景去除叶子图像捕获使用FCNNs场条件下是可能的,(2)我们已经表明,语义分割网络可以用来执行实例分割对象的一个实例提供目标主导图像即使图像包含其他相似但不太突出对象。

2. Tomato leaf segmentation algorithms for mobile phone applications using deep learning

摘要 :在本文中,我们提出全卷积神经网络来执行在移动应用程序中捕获的叶子图像的自动背景减法。在移动应用程序中使用在这种情况下,目标叶片通常会主导农民拍摄的图像。叶子也会被包围通过各种背景特征,包括其他叶、茎、果实、土壤和覆盖物。

分割网络 的目标是去除这些背景特征,从而只保留目标叶片。为了训练和测试提议的网络,准备了一个代表这种情况的数据集。它由1408个 番茄叶片图像组成。所提出的技术取代了竞争的背景减法算法,但不需要用户干预,也不限制目标叶片的方向,形状或照明。此外,所有CNN模型能够在GPU上运行时在0.12秒内对256x256像素的RGB图像执行分割,在CPU上运行时在2.1秒 内执行分割;这比任何竞争技术都快得多。结论 :我们研究已经表明,语义分割网络 可以用来执行实例分割对象的一个实例提供目标主导图像即使图像包含其他相似但不太突出对象。

本文还对两种损耗函数在像素分类层的性能进行了评估。我们已经报道过GDL优于交叉熵损失,并执行更干净的掩模边界。提出网络实现超过0.96 mwIoU 0.91 mBFScore储备测试集。具体地说,我们提出设计KijaniNet得分0.9766 mwIoU和0.9439 mBFScore储备测试集,我们知道没有其他研究现有文献中,产生类似的结果在叶子图像分割任务。总结 : 我个人不知道这个的难度,看起来也不是很难的样子。但作者的描述而言,他好像是第一个做这个的人。参考价值:4分。

3. Biophysical parameters of coffee crop estimated by UAV RGB images

总结 :这项工作旨在评估使用SfM点云的摄影测量技术的准确性,该点云用于通过无人机用RGB(红色,绿色,蓝色)获得的航拍图像估算咖啡树的高度(h)和树冠直径(d)相机并将结果与12个月现场测量的144棵树的数据进行比较。旋翼无人机用于自动飞行模式,并与常规相机连接,以30m的高度飞行,图像重叠率为80%,速度为3m / s。使用PhotoScan软件处理图像,并在Qgis中进行分析。在野外获得的h值与通过无人机获得的h值之间的相关性为87%,在野外获得的d值与通过无人机获得的值之间的相关性为95%。使用通过RGB数码相机获取的UAV–SfM图像,可以获得诸如咖啡树的h和d之类的属性的大量估计值。优点 :有一年的数据。缺点 :他这个咖啡树的高度和树径的评估预测,不能概括为是生理数据这么大范围。用的分析方向是相关性分析。参考价值 :2分。

4. Vineyard yield estimation by combining remote sensing, computer vision and artificial neural network techniques

总结 :通过结合植被指数(VI)来感知作物的健康状况并通过计算机视觉获得植被分数覆盖率(Fc)来预测最终产量,以衡量植物的活力。从无人飞行器(UAV)获得的多光谱图像可用于获取VI和Fc,并与人工神经网络 (ANN)一起使用,以对VI,Fc和产量之间的关系进行建模。所提议的方法被应用在葡萄园中,在该葡萄园中使用了不同的灌溉和施肥剂量。结果表明,在精密的葡萄栽培中,使用计算机视觉技术区分冠层和土壤是获得准确结果的必要条件。此外,结合使用VIs(反射法)和Fc(几何法)来预测葡萄园的产量会带来更高的准确性(均方根误差(RMSE)= 0.9千克藤蔓-1和相对误差(RE)= 21.8%)与接近使用VI相比(RMSE = 1.2 kg vine-1和RE = 28.7%)。机器学习技术的实施比线性模型(RMSE = 0.5 kg vine-1和RE = 12.1%)产生的结果更准确。

优点 :该研究有一年生理实验的多个处理数据,大量的大田实验与对照实验来检验无人机拍摄的图片预测葡萄产量的结果。逻辑清楚,结构合理。缺点 :运用的方法在计算机方面确实不新。参考价值 :4分。

5. Accuracy of carrot yield forecasting using proximal hyperspectral and satellite multispectral data

总结:近端和远端传感器已经证明了它们对许多不同作物的一些生物物理和生物化学变量的估计,包括产量的有效性。对它们在蔬菜作物中的准确性评价是有限的。

本研究探讨了近端高光谱和卫星多光谱传感器(Sentinel-2和WorldView-3)在不同作物配置、季节和土壤条件下对胡萝卜根产量的预测精度。采集了澳大利亚西澳大利亚州(WA)、昆士兰州(Qld)和塔斯马尼亚州(Tas) 24个田414个样点的地上生物量(AGB)、冠层反射率和相应的产量测量值。以不同植被指数(VIs)与产量的总决定系数(overall determination coefficient between yield and different vegetation index, VIs)最高为最佳传感器(高光谱或多光谱),以线性和非线性模型为最佳传感器(linear and nonlinear models),确定最佳传感器(VIs)及其对空间分辨率的影响。每个区域的最佳回归拟合用于将点源测量值外推到每个采样作物的所有像素,从而产生一个预测产量图,并估计作物水平上的平均胡萝卜根产量(t/ha)。

后者与从种植者获得的商品胡萝卜根产量(t/ha)进行比较,以确定预测的准确性。实测产量在17 ~ 113 t/ha之间变化,平均产量预测的总体精度(%误差)在WA为9.2%,Qld为10.2%,Tas为12.7%。来自高光谱传感器的VIs产生的产量相关系数(R2 < 0.1)低于来自多光谱传感器的类似测量(R2 < 0.57, p < 0.05)。空间分辨率从10 m提高到1.2 m,回归性能提高了69%。不可能对胡萝卜等根类蔬菜在收获前的空间产量变化进行无损估计。回归系数为0.27-0.77,且误差达到了1%。优点 :有丰富的大田实验,采用了不同地域的田地进行了综合分析,判断预测的准确率。 缺点 :实际效果不佳。参考价值 :3.5分。

6. Evaluation of cotton emergence using UAV-based imagery and deep learning

总结 :本研究旨在开发一种新型的无人机图像处理方法,以实现无人机图像的近实时处理。本研究利用无人机成像系统采集棉花幼苗的RGB图像帧,以评价林分数量和冠层大小。对图像进行预处理,以纠正失真,计算地面样本距离和图像中的地理参考棉花行数。

利用预训练的深度学习模型resnet 18在每个图像帧中估计棉花幼苗的林分数量和冠层大小。结果表明,在试验数据集上,该方法能够准确估计林分数,R2 = 0.95。在测试数据集中,冠层尺寸的估算精度为R2 = 0.93,也得到了类似的结果。对每个作物行都有地理参照的2000 M像素图像帧的处理时间为2.22 s(包括预处理的1.80 s),比传统的基于拼接的图像处理方法效率更高。开发了一个开放源代码的自动图像处理框架,用于棉花出苗率评估,并可向社区提供有效的数据处理和分析。

本研究利用基于无人机的RGB图像和深度学习技术,开发一个有效的图像数据处理和分析框架,用于及时评估棉花的出现。本研究不同于以往发表的研究,其方法是直接处理单个图像帧,而不是开发正构图像以减少处理时间。具体目标包括:(1)开发预处理管道,在每个单独的图像帧中分割和地理参考作物行;(2)实现深度学习模型,以估计棉花数量和冠层大小;(3)建立基于地理信息的棉花应急地图自动生成框架。优点 :大量的大田实验和无人机监测图片。缺点 :不知道。参考价值 :2分。因为我们没有设备也没有实验地。

7. Deep learning techniques for automatic butterfly segmentation in ecological images

摘要 :基于深度学习的方法在蝴蝶生态图像分割方面 比传统方法更具前景,因为它们具有强大的特征学习和表示能力。但是,当图像中出现复杂的背景干扰时,蝶形分割仍然具有挑战性。

为了解决这个问题,我们提出了一种扩展的编码器网络 ,以捕获更多高级功能并获得高分辨率输出,该输出既轻巧又准确,可以自动进行蝴蝶生态图像分割。另外,我们采用骰子系数损失函数来更好地平衡蝶形和非蝶形区域。结论 :本文提出了一种膨胀的自编码器网络。首先,将原始的蝴蝶生态图像输入到膨胀的特征编码器模块 (膨胀卷积)中。然后将提取的特征馈入特征解码器模块并生成分割图。另外,我们采用骰子系数损失函数来更好地平衡蝶形和非蝶形区域。在利兹蝴蝶数据集上的实验结果表明,我们的方法优于基于最新的深度学习的图像分割方法。实验结果表明,该方法基本克服了生态图像中蝴蝶的自动分割问题。

这项工作的主要贡献概括如下:(1)我们提出了一个HCDC模块,以捕获更多的高级功能并获得高分辨率的输出; (2)我们将提出的HCDC块与编码器-解码器结构集成在一起,以构建一种称为“扩展编码器网络”(DE-Net)的新型网络结构; (3)据我们所知,这是使用深度学习对复杂蝴蝶生态图像进行分割的首次尝试。在我们的实验中,针对自然图像分割设计的五种最先进的深度学习方法被应用于利兹蝴蝶数据集,以与所提出的方法进行比较。实验结果表明,该方法的准确性优于最新方法。 (4)提出的DE-Net比蝶形生态图像分割问题小1.2到6倍,可以实现比大型模型更好的学习能力,从而节省了存储空间并提高了模型的可移植性。

个人总结 :该论文运用的是网络数据集。语义分割的方法。不知道方法是否创新。结构合理,逻辑合理。参考价值 :4分。

8. Improving segmentation accuracy for ears of winter wheat at flowering stage by semantic segmentation 利用语义分割提高冬小麦穗开花期的分割精度

摘要 :在这项研究中,提出了一种基于语义分割 的方法,即EarSegNet,以执行像素级分类 ,以从实地条件下捕获的冠层图像中分割出小麦的耳朵。 EarSegNet集成了编码器-解码器结构和扩展卷积,旨在进一步提高冬小麦耳朵的分割精度和效率。结果表明,提出的EarSegNet能够从花期捕获的冠层图像中实现小麦耳朵的精确分割(分割质量= 0.7743,F1得分= 87.25%,结构相似度= 0.8773)。

为了验证所提出的方法,将所提出的EarSegNet的性能与广泛使用的分割方法(即SegNet,两阶段方法和Panicle-SEG )进行了比较。结果表明,所提出的EarSegNet优于已比较的方法,从而成为了一种强大的有效工具,可根据在播种期捕获的树冠图像对冬小麦的耳朵进行分割。泛化测试表明,所提出的EarSegNet的性能优于比较方法,表明EarSegNet在现场应用方面具有巨大的潜力。所得结果表明,编码器的深度(即VGG16)对EarSegNet的性能没有显著影响,但是,加深VGG16可以提高EarSegNet的召回评估指标的性能。方法 :得到每个生长季节36张原始图像。

这些图像的像素分辨率为5184 × 3456,然后手工裁剪并重塑为2500 × 2500像素分辨率。由于每个小区有3幅ROI图像,因此随机从每个小区中选取2幅ROI图像构建语义分割网络,左边一幅用于性能评价,即48幅用于构建模型,24幅用于性能评价。最后图片扩增到3000张。个人总结 :结构清晰,逻辑合理。好像是有一点创新。可参考价值 :4分。

2.3 目标检测

1. Brown rice planthopper (Nilaparvata lugens Stal) detection based on deep learning

总结 :褐飞虱是水稻的主要害虫之一。快速、准确地检测稻飞虱,有助于及时处理水稻。由于BRPHs体积小、数量多、背景复杂,对其进行图像检测具有一定的挑战性。本文提出了一种基于深度学习技术的两层检测算法来检测它们。这两个层的算法是更快的RCNN(带有CNN特征的区域)。为了有效地利用计算资源,为每一层选择了不同的特征提取网络。此外,对第二层检测网络进行了优化,以提高最终检测性能。

将两层检测算法的检测结果与单层检测算法的检测结果进行比较。对检测不同群体和数量BRPHs的双层检测算法的检测结果进行测试,并与深度学习目标检测网络YOLO v3进行比较。测试结果表明,两层检测算法的检测结果明显优于单层检测算法。在不同数量的BRPHs测试中,该算法的平均召回率为81.92%,平均正确率为94.64%;YOLO v3的平均召回率为57.12%,平均正确率为97.36%。在不同年龄的BRPHs实验中,该算法的平均召回率为87.67%,平均正确率为92.92%。YOLO v3的平均召回率为49.60%,平均正确率为96.48%。优点 :结构合理。缺点 :训练集测试集验证集的比例为8:1:1。数据集的较小。参考价值 :1分。

2. Identification of olive fruit, in intensive olive orchards, by means of its morphological structure using convolutional neural networks

总结 :由于橄榄栽培具有较高的经济价值,因此准确的产量估算是橄榄栽培的一个重要目标。本文提出了一种旨在实现这一目的的方法论。它包括一个人工视觉算法,能够检测可见的橄榄树的数字图像,在夜间,在人工照明下直接在田间捕获。这些照片拍摄于2018年9月(收获前两个月),地点是欧洲皮油橄榄(Picual Olea europaea L.)的一个密集橄榄果园。在该方法中,首先对图像进行预处理,生成一组含有橄榄的高概率子图像,从而将搜索空间缩小到103的量级。接下来,这些子图像被卷积神经网络(CNN)分类为橄榄,如果它们以橄榄水果为中心,或者在任何其他情况下(即使它们包含外围水果)。

为了训练和验证CNN,一个名为OLIVEnet的特殊数据库被编译成两个不相交的集合,整合了这些子图像。分别用234,168和299,946个olive子图像和其他子图像构建了训练集和验证集。我们测试了五种不同的CNN拓扑结构 ,在83.13%的olive实例中正确地分类了表现最好的一个,准确率为84.80%,在其他实例中准确率为99.12%;测量精度为0.9822,F1得分为0.8396。就作者的知识而言,本文提出了第一个图像分析方法,以自动识别直接在田间拍摄的整棵树的图像中的橄榄果实。个人总结:这篇论文不咋地。

2. 机器学习

1. A random forest ranking approach to predict yield in maize with uav-based vegetation spectral indices

总结 :提出了一种基于排序的方法来增强RF 方法对玉米产量预测的潜力。该方法基于单个植被指数(VIs)的相关参数。VIs是根据一个价值指标进行单独排名的,该指标通过使用RF对比基线方法来衡量皮尔逊相关系数的改进。因此,只有最相关的VIs被认为是射频模型的输入特征。我们使用了从多光谱无人机(无人机)图像中提取的33个VIs。

利用Sequoia和MicaSense两种不同的传感器生成多光谱数据;分别为2017/2018和2018/2019作物季。在所有评价指标中,NDVI、NDRE和GNDVI排名前三,它们与RF的结合提高了玉米产量预测。结论是:基于排序的植被恢复策略指数(VIs)可以实现随机森林(RF)算法的潜在化仅使用多光谱无人机图像预测玉米产量。优点 :有2年时间的数据,用无人机拍摄的图像。有11个玉米品种,且有33个相关指标。数据量大。缺点 :大田实验数据的结果并没有在文中出现。而操作方法也挺简单的。

3. 其他

1. DropLeaf: A precision farming smartphone tool for real-time quantification of pesticide application coverage

总结: 这项工作介绍并实验评估了一种新型工具,该工具可用作基于智能手机的移动应用程序,名为DropLeaf-Spraying Meter。使用DropLeaf进行的测试表明,尽管操作简便,但仍可以高精度估算农药的覆盖率。我们的方法基于定制图像分析软件的开发,用于实时评估水敏纸的喷涂沉积。所建议的工具可以被携带常规智能手机的农民和农艺师广泛使用, DropLeaf可轻松用于各种方法的喷雾漂移评估,包括新兴的无人机和智能喷雾器。这篇论文讲了一个开发的APP,名字为DropLeaf。可以用于评估农药喷洒的覆盖率。优点 :开发了可用的APP。缺点 :市面上已有类似的APP。 参考价值 :2分。

2. Underutilised crops database for supporting agricultural diversification

总结 :本文构建一个可使用的全局访问数据库的尝试为未充分利用的作物储存信息。检查了设计相关的农业数据库、数据标准和作物多样化的重点,建立了一个数据模型包括粮食系统中作物价值链的主要元素。为了保证数据的准确性,我们添加了一个元数据表,该表存储关于数据库中记录的所有数据源的信息。并为数据管理和访问构建了基于web的用户界面。开放访问的用户界面允许根据用户需求进行简单的数据排序和过滤操作。 优点 :建立了一个数据库,开发了网站。 缺点 :不知道。 参考指数 :2分。

3. Replacing traditional light measurement with LiDAR based methods in orchards

总结 :该文利用树木的虚拟模型可以分析光照环境,以及树冠体积等几何测量。但是,这些仿真模型允许对不能直接测量的变量进行分析。该研究提出了一项基于激光雷达的方法的研究,以取代光拦截使用轻型小车,显示了不错的结果,具有广泛的适用性。(这篇论文是探究LiDAR激光雷达捕获光数据的效果,且与传统方法的结果进行的对比)。优点 :探讨了新方法来测量树木的光拦截效率,验证了其可能性。缺点 :不知道。参考指数 :3分。

4. A cyber-physical intelligent agent for irrigation scheduling in horticultural crops

摘要 :本文介绍了基于智能代理概念的电子物理作物灌溉系统的设计和实现。该系统允许通过传感器获取现场信息,根据决策系统加水并激活电磁阀。解释了通信能力和性能测量,环境,致动和传感系统(PEAS)。通过中央站及其互联网连接,可以在场中或从其他位置远程进行监视。该系统的性能评估是通过使用作物建模软件和位于哥伦比亚博伊亚卡和费拉维托沃巴的大规模灌溉和排水区的一个试验作物进行的。

开发的系统可以通过几种灌溉策略使土壤湿度保持在田间持水量附近,并避免了水资源浪费和过度使用。该论文的创新之处在于将智能体的推理和主动能力集成到嵌入式板 中。该开发的系统允许使用嵌入式系统作为中心站 进行灌溉调度和水管理,并拥有一个集中的服务器用于信息存储和监控,使用具有互联网接入的设备。方法 :cyber-physical设计原则遵循智能的概念agent基于多个子系统的集成,如图1所示。该智能体由位于现场的智能多传感器阵列(SMSA)和完成感知系统功能的气象站子系统(WSS)组成。此外,代理使用灌溉激活子系统(IAS)在现场执行操作。

无线电收发模块用于在SMSA、IAS和位于农家的代理中心站(ACS)之间生成网状网络。实现了一个web服务器来从de ACS和WSS获取数据。其他系统可以参考web服务器数据库来监控决策中的任务支持活动。SMSA和IAS子系统采用ATmega328p单片机。WS和ACS使用Raspberry- Pi®- 3b板开发。

Fig. 1. Cyber-physical intelligent agent architecture for irrigation scheduling

Fig. 2. Smart Multi-Sensor Array (SMSA). Source: Authors.

Fig. 3. Irrigation Activation Subsystem (IAS). Source: Authors.

在土壤传感器配方中,根据土壤水分传感器的测量来确定耗竭和浇水时间。这些结果证实了基于产量和水分利用效率预测的智能agent灌溉调度系统适用于灌溉调度,能够提高节水效果。

总结 :该论文主要讲了如何利用传感器和一些硬件配置来判断作物灌溉需水,达到节约用水的目的。优点 :有硬件有实验。缺点 :不知道。参考价值 :4分。

5. Biophysical parameters of coffee crop estimated by UAV RGB images

利用无人机RGB图像估算咖啡作物的生物物理参数数字农业的发展与计算工具和无人驾驶飞行器(UAV)相结合,使得数据的收集能够可靠地提取植被指数和从运动结构(SfM)算法得到的生物物理参数。本工作旨在评估使用SfM点云的摄影测量技术在无人机使用RGB(红、绿、蓝)相机获得的航空图像中估计咖啡树高度(h)和树冠直径(d)的准确性,并将结果与12个月的现场测量数据进行比较。实验在巴西米纳斯吉拉斯的一个咖啡种植园进行。采用旋转翼无人机自主飞行模式,与常规相机耦合,在30m高度飞行,图像重叠率为80%,速度为3m/s,图像处理采用PhotoScan软件,并在Qgis中进行分析。

野外测得的h值与无人机测得的h值之间的相关性为87%,野外测得的d值与无人机测得的d值之间的相关性为95%。使用RGB数码相机获取的UAV–SfM图像,可以获得对属性的重要估计,例如咖啡树的h和d。

6. A satellite-based ex post analysis of water management in a blueberry orchard

摘要 :在当前由气候变化造成的水资源短缺和粮食生产对水的需求增加的情况下,农民必须适应水的管理方式,从供应驱动的水管理转向需求驱动的水管理,并考虑到利益相关者之间的权衡。质量,数量和成本。因此,农业实践必须充分利用技术,研究和开发的优势,并适应当地的要求。如今,遥感已成为估算作物需水量(蒸散量)以及绘制其空间和时间变化的有用工具。在这项工作中,我们提出了一种新的方法,该方法允许用户使用称为AquaSat®的灌溉决策决策支持系统作为主要工具 ,对智利中部蓝莓田的灌溉策略进行审核(事后)。

该工具将卫星信息与现场数据 结合在一起,并提供有关作物用水的空间分布信息,以管理农场规模的灌溉。这项工作的主要贡献是,通过比较所施加的水量,蒸散量和潜在需求,详细介绍了一种灌溉管理的新方法。该程序使用户可以审核当前的灌溉管理并确定对生产力的影响。根据我们的结果,我们可以得出结论,整个灌溉部门在两个季节中农场使用的施水量不足以达到潜在的蓝莓产量。

在这项工作中,我们提出了一种新的方法,该方法允许使用称为AquaSat®的灌溉决策决策支持系统来审核(事后分析)灌溉策略。该系统将卫星信息与实地数据相结合,并提供时空分布的作物蒸散量(ETc),并将其与施水量和潜在需求(达到最大产量的水量)进行比较。 本文以智利中部的蓝莓灌溉为例,说明了这种新颖方法的潜力。另外,AquaSat®是作者团队研究开发的决策支持系统这使得估计作物蒸散量(等)和它们的需水量,根据灌溉项目。它也是事后审核农民灌溉战略的有用工具(Lillo-Saavedra, 2019)。

个人总结 :方法逻辑是清楚的。这篇论文感觉是做的挺好的,实验和模型设计。但我还是不知道是如何测得叶片蒸发量,通过卫星信息。

7.A 3D white referencing method for soybean leaves based on fusion of hyperspectral images and 3D point clouds

摘要 :由于光源在不同波长的光强不均匀,原始图像需要使用白色基准进行校准。扁平的白色面板通常作为白色参考扫描。然而,像叶片倾斜角这样的几何因素不能用扁平的白色基准来校准。在这个出版物中,使用有角度的白色参考校准相应的原始图像的有效性首次被证明。此外,还创建了一个集成了高光谱相机和Kinect V2深度传感器系统中不同角度和空间位置的3D白色参考库。

这样,叶片表面的像素可以通过三维参考库中倾斜角度和空间位置最近的点进行校准。该参考库的验证样本为温室大豆叶片。结果表明,与传统的平白参照定标相比,三维定标后的反射率光谱更接近标准定标(平白参照定标平叶)。此外,三维定标后的大豆叶片表面像素级归一化差值植被指数(NDVI)分布也更接近标准定标。该方法具有提高植物图像标定质量的潜力。与激光雷达传感器相结合,这种新方法有机会应用于野外环境。关键词 :植物表型·不均匀照明·高光谱图像校准·3D白色参照库·3D点云。 我看不太懂这个论文。

8. Assessing winter wheat foliage disease severity using aerial imageryacquired from small Unmanned Aerial Vehicle (UAV)

摘要 :通过飞行旋翼无人机获取红色,绿色和蓝色波段(RGB)图像。然后处理图像以发展正马赛克,并计算了三个植被指数。对获得的图像数据集进行进一步处理以生成绘图级数据。记录田间反应和叶锈病严重程度的视觉记录,以计算感染系数(CI)。在这两年中,发现小麦基因型之间的植被指数存在显着差异。标准化差异指数(NDI),绿色指数(GI)和绿叶指数(GLI)与CI呈线性相关,2017年的R2值范围为0.72至0.79(p <0.05),而2017年的R2值范围为0.63至0.68(p <0.05) 2018年。地面归一化差异植被指数(NDVI)在两个年份中也显示出与CI的显着相关性(R2 = 0.86,p <0.05,2017年; R2 = 0.83,p <0.05,2018年)。结果表明,无人机成像和自动数据提取可以促进针对疾病严重性等级的高通量表型数据的获取。

[论文总结] 深度学习在农业领域应用论文笔记13

1. Downscaling crop production data to fine scale estimates with geostatistics and remote sensing: a case study in mapping cotton fibre quality (Precision Agriculture ,2024, IF=5.585)

背景

棉花的质量和产量影响种植者的收入,棉纤维质量由许多不同的测量值表示,包括纤维长度、强度、微米(纤维细度(直径)和成熟度的复合测量值)、颜色和垃圾(样品中棉纤维以外的任何材料,例如叶子和植物物质)含量,并以多种等级进行描述,这些等级会影响最终的价格。目前有很多的预测产量的方法,但是缩小尺度,即将粗略的空间分辨率数据分解为更精细的分辨率预测,区域数据在农业和地理应用中是一个挑战,包括作物产量预测(Brus et al., 2018),以及在不同空间分辨率下处理遥感影像时(Wang et al., 2015).安装在收割机上的移动产量监测器不适用于所有作物,也不适用于全球所有地区。相反,块状、亚田或全田尺度的区域观测通常是许多商品(包括甘蔗和人工收获的园艺作物)唯一可用的产量数据。虽然棉花产量可以通过安装在收割机上的产量监测器轻松绘制,但棉花纤维质量不能像其他作物的质量变量(例如谷物蛋白质含量)那样随时随地绘制。取而代之的是,棉纤维质量数据是在收获后收集的,通常作为整个或部分田地的平均值返回给种植者,这些数据与田间位置没有直接关系。因此,本文介绍了一种缩小和解锁现有模块聚合棉花质量数据的方法,以便更精确地管理棉纤维质量。本研究的目的是:

评估遥感影像对棉花产量和纤维质量变量变化进行建模的能力。这是缩小规模方法的基础。使用精细分辨率的良率数据来说明和测试降尺度方法。注意,本研究的目的不是在收获前预测棉纤维质量。

方法

研究区域和可用数据:2021/22 生长季节从澳大利亚新南威尔士州两个棉花种植区的 11 块田地收集了棉纤维质量和产量数据。该数据集包括新南威尔士州南部(SNSW)的3个洪水灌溉棉田和新南威尔士州北部(NNSW)的8个洪水灌溉棉田。棉花于2021年10月/11月播种,由于本季收尾潮湿,直到2022年7月才收获。因此每个模块的每个纤维质量变量都有一个值。对于每个田地,在33至216公顷的田地中,有72至484个单独的棉花模块数据可用。每个田地总共有364至2945包棉纤维质量数据。收割时,通过安装在收割机上的产量监测器随时随地记录产量数据。

整个生长季节(2021年10月至 2022年7月)的所有遥感图像均从 Sentinel-2 以 10 m 的空间分辨率获得,重访时间为 5 天。使用Sentinel-2影像推导出一套植被指数,包括归一化差异植被指数(NDVI)、归一化差异红边(NDRE)、增强植被指数(EVI)、冠层叶绿素含量指数(CCCI)、绿红植被指数(GRVI)、红边比(RE/R)、比率光谱指数(RSI)和优化土壤调整植被指数(OSAVI)。鉴于这八种不同的植被指数在监测、建模和预测棉花生长、营养、产量和/或纤维质量方面的性能各不相同,本研究旨在评估不同植被指数在田间空间上捕捉和描述棉纤维产量和质量变化的能力,特别是将棉纤维质量数据缩小到精细分辨率。此外,如果一个植被指数与特定纤维质量变量的相关性更强,或者显示出明显的时间趋势,例如,该指数可能对本研究范围之外的未来研究有用,例如纤维质量预测。

将所有遥感协变量重新采样为两种分辨率:(1)第一种是每个场的5 m分辨率以构建协变量网格;(2)第二个是在每个模块多边形(块)中提取的模块聚合(平均值)值。模块聚合协变量和精细分辨率协变量网格分别用于趋势模型构建和预测。使用 5 m 网格来最好地表示棉模块宽度。

然后采用了不同方法建模与决策。模块聚合面积产量、纤维质量和协变量数据数据集被拆分,变量选择的 70% 校准、30% 验证拆分、模型校准和所有建模和降尺度方法的验证。趋势(多元线性回归,MLR或随机森林)和A2PK建模都是在模块的空间支持(块支持)下进行的,所有模型都是使用校准数据集构建的。然后将趋势(MLR 和 随机森林)模型应用于精细分辨率协变量网格,以在点支持处生成降尺度预测。

结果

与遥感协变量的相关性对棉纤维产量的相关性比棉纤维微米级的相关性更强,与棉纤维长度的相关性要强得多。在几乎所有田地中,使用具有或不具有A2PK的遥感协变量回归,可以用良好的模型质量估计棉纤维产量和微米级的空间趋势。相反,棉纤维长度的模型质量较差,零模型和趋势模型之间的模型性能差异很小。当使用精细分辨率产量观测测试降尺度方法时,与模块分辨率相比,精细分辨率下的模型性能更差。

结论

在这项研究中,展示了一种降尺度方法,其中使用具有精细分辨率遥感植被指数的回归来估计棉纤维产量和质量的空间趋势。如果可以估计空间趋势,则使用 A2PK 从趋势模型中缩小残差。然而,在没有空间趋势模型的情况下,将 A2PK 与零模型(场均值)进行比较,以确定将区域观测值从块体缩小到点支座的最佳方法。与遥感协变量的相关性对棉纤维产量的相关性比棉纤维微米级的相关性更强,与棉纤维长度的相关性要强得多。从广义上讲,生长季节后半段的协变量相关性更强,在回归模型中使用更频繁。在几乎所有领域,棉纤维产量和微米级的空间趋势都可以在良好的模型质量下使用遥感协变量回归进行估计。相反,棉纤维长度的模型质量较差,零模型和趋势模型之间的模型性能差异很小。残差的添加 A2PK 提高了缩小面积棉纤维产量观测的模型性能,但对棉纤维微米没有。在没有高分辨率长度或微米数据的情况下,使用高分辨率棉纤维产量数据作为替代物来测试降尺度方法。与模块分辨率相比,模型在精细分辨率下的性能较差也就不足为奇了,但预计降尺度方法在形状更规则的区域数据上会表现得更好,例如树木作物的果仓产量。

个人总结

这篇论文的立意是从实际出发的,与很多根据卫星图像来预测产量的文章不同,该研究的目的强调了不是产量预测而是提出使用棉花种植区块产量和纤维质量(长度和微米)数据来说明作物生产数据的缩小区域观测的通用方法。在实验数据方面,采用了澳大利亚11个种植区域2年生长季节260天的生长数据,8种不同植被指数、32个协变量和棉花的产量和棉纤维微米(质量)以及总共有约25张卫星图像可用于 NNSW区域,约70 张图像可用于SNSW区域。数据量挺大的,做的内容也具有实际意义。挺好的一篇文章。投稿评分:大量的大田实验+5分,立意+0.5分,单位是澳大利亚悉尼大学+0.5分,写作+1分=7分。

2. A Systematic Collection of Medical Image Datasets for Deep Learning (ACM COMPUTING SURVEYS,2023, IF=21.77)

摘要:本文尽可能全面地提供了一系列医学图像数据集,以及它们对深度学习研究的相关挑战。我们收集了 2007 年至 2020 年间主要报告的约 300 个数据集和挑战的信息,并将它们分为四类:头颈部、胸部和腹部、病理和血液等。我们工作的目的是提供一个尽可能最新和完整的列表,可以用作参考,以便轻松找到用于医学图像分析的数据集以及与这些数据集相关的信息。

背景

在将深度学习方法应用于特定领域时,数据稀缺是一个常见问题,而在医学图像分析的情况下,这个问题变得更加严重。将深度学习方法应用于医学图像分析研究的研究人员通常不具有医学背景,通常是计算机科学家。由于无法获得医疗设备和患者,他们无法独立收集数据。他们也无法对获得的数据进行注释,因为他们缺乏相关的医学知识。此外,医疗数据归机构所有,由于隐私和道德限制,这些机构不容易公开。为了解决这些问题,MICCAI、ISBI、AAPM 等会议和机构发起了许多与 DL 相关的医学图像分析挑战。这些旨在设计和开发自动或半自动算法,并利用计算机辅助方法促进医学图像分析研究。同时,一些研究人员和机构还组织项目收集医学数据集并发布用于研究目的。尽管做了所有这些工作,但对于医学图像分析的新手来说,找到医疗数据仍然具有挑战性。因此,我们提出了这项对医学数据集和相关挑战的全面调查,旨在帮助研究人员轻松找到他们研究所需的数据集。

医学数据集

时间线身体部位 :这些数据集和挑战中,前5个聚焦器官包括大脑、肺、心脏、眼睛、肝脏。方式:与分割、分类、检测和其他任务相关的数据集数量有所增加。研究主要集中在早期阶段的分割(28、29、54)任务上。然后,它多样化为各种任务或任务组合,这些任务对于临床需求也是必不可少的,包括分类(154,197,259),分割(1,2),检测(199,232),回归(213,214),生成(14,19),跟踪(220,245)和注册(24,25,166)任务:常用的医学数据集获取方式包括MRI、CT、超声、内窥镜检查、正电子发射断层扫描(PET)、计算机X线摄影(CR)、心电图和OCT源和目标:回顾了涉及医学图像分割和分类的论文。这使我们能够确定数据集的多个来源,包括举办医学影像相关竞赛的网站 Grand Challenge 和癌症影像档案馆 (TCIA),一个举办癌症相关竞赛的网站。此外,我们还利用 Google 搜索其他相关网站和馆藏,这些网站和馆藏包含与使用 DL 进行医学图像分析相关的数据集和挑战。通过这个过程,我们发现了Kaggle、Codalab、OpenNeuro、PhysioNet,以及受到Grand Challenge和TCIA启发的科学期刊,如Scientific Data。接下来,通过这些网站进行爬虫,以收集有关这些网站上特色的数据集/比赛的信息,并根据可用信息仔细选择数据集和挑战。

头颈相关的数据集和挑战

(不展开了)

胸部和腹部相关的数据集和挑战

(不展开了)

病理学和血液学的数据集和挑战

(不展开了)

讨论

主要讨论了医学数据的稀缺性以及有效获取数据方法等。

个人总结

这篇论文有个非常大的缺点就是几乎所有的论文配图都不清晰,以至于我即使下载了图片也无法看清图中的文字。尤其对于很重要的图而言,这个缺陷是论文的完整性而言致命的。虽然投稿期刊的影响因子很高,但我个人觉得论文还可以再进一步改进。论文一个很大的优点是总结了医学数据集论文,这点可以供很多相关学科研究人员信息参考。

3. PhenoBench: A Large Dataset and Benchmarks for Semantic Image Interpretation in the Agricultural Domain (IEEE TRANSACTIONS ON PATTERN ANALYSIS AND MACHINE INTELLIGENCE,2024,IF=22.2)

摘要:虽然其他领域的大型数据集和基准已经随时可用,并推动了显著的进展,但农业数据集和基准相对较少。我们提出了一个带注释的数据集和基准,用于对真实农业领域进行语义解释。我们的数据集通过无人机记录,提供了高质量的、逐像素的作物和杂草注释,同时还提供了作物叶片实例的注释。此外,我们在一个由不同田地组成的隐藏测试集上为各种任务提供了基准,包括已知田地(由训练数据覆盖)和一个完全看不见的田地。我们的数据集、基准和代码可在https://www.phenobench.org获取。

背景

基于视觉感知系统的机器人和无人机可以通过提供更好的田间管理决策工具和支持作物新品种的培育来帮助应对这些挑战。计算机视觉在图像解释方面取得了巨大进展,数据集和相关基准对于这一进展至关重要,而农业领域缺乏大规模数据集和可重复的基准。本文旨在提供一个带有基准的大型数据集,用于农业领域的语义解释,涵盖语义分割、全景分割、植物检测、叶片检测和分层全景分割等任务。

相关的工作

近年来,由于深度学习的发展和大规模数据集的可用性,图像的密集、逐像素语义解释(如语义、实例和全景分割)取得了快速进展。农业领域面临着不同的挑战,如植物生长导致的类内变异性大,虽然已有一些相关数据集,但准确密集注释的大型农业数据集以及在隐藏测试集上的可重复基准仍然缺失。本文的数据集具有独特的注释水平,包括作物和杂草的语义和实例掩码,以及作物的时间一致实例标识,并且提供了可比较和可重复的结果。

我们的数据集

数据收集使用配备高分辨率相机的无人机在不同日期对糖用甜菜田进行多次飞行,以捕获不同生长阶段的图像,飞行高度约为21米,地面采样距离为1毫米,图像分辨率为11664像素×8750像素,通过DJI Ground Station Pro应用程序规划覆盖整个田地的飞行,设置前后重叠和侧重叠,并使用机载GNSS进行地理参考。标注过程:由于原始图像尺寸大,难以标注,因此提取重叠的2000像素×2000像素的补丁进行并行标注,确保每个植物至少在一个补丁中完全可见,标注过程分为四轮,首先标注植物实例,然后标注叶片实例,每轮标注都经过验证和修正,最终由14名标注员投入约2000小时完成标注。时间对齐通过利用无人机RTK GNSS提供的位置进行束调整,确定相机在每个捕获图像中的姿态,从而实现时间上对齐的植物实例,以便研究单个植物的生长,通过匈牙利匹配算法根据作物中心的距离稳健地关联在不同图像中出现的相同植物的实例。数据集统最终从全局图像中提取1024像素×1024像素的较小图像,以确保包含完整的作物并提供上下文信息,数据集统计信息包括不同分割的图像数量、作物实例数量、杂草实例数量和作物叶片数量等,还提供了未标记数据用于预训练、半监督或无监督域适应研究,数据集中的植物由于生长阶段和土壤条件的不同而具有多样性,并且植物之间的重叠也有很大变化。

基准

语义分割:任务是训练模型预测每个像素的类,提供了将每个像素分配给土壤、作物或杂草类的标注数据,基线方法选择了DeepLabV3+和ERFNet,使用交并比(IoU)和平均交并比(mIoU)进行评估,结果表明现有方法总体性能较好,但杂草的IoU相对较低,模型容量对解决该问题影响不大。全景分割:任务是联合估计像素级语义标签和区分实例,包括“stuff”(无实例类,如土壤)和“thing”(有明确可分离对象的类,如作物和杂草),基线方法使用Panoptic DeepLab、Mask R - CNN和Mask2Former,使用全景质量(PQ)、作物的PQ(PQcrop)、杂草的PQ(PQweeds)和土壤的IoU(IoUsoil)进行评估,结果表明Mask2Former性能最佳,植物实例分割在小植物几乎不可见和大植物高度重叠的情况下具有挑战性。检测:任务是检测植物或叶片实例,通过从实例级注释中提取边界框来训练目标检测方法,基线方法选择Faster R - CNN、Mask R - CNN和YOLOv7,使用平均精度(AP)、平均平均精度(mAP)、mAP50和mAP75进行评估,结果表明现代方法在作物检测方面具有优势,而杂草检测更困难,叶片检测的性能相对较低,需要领域特定的方法。叶片实例分割:任务是预测每个可见作物叶片的实例掩码,与对象检测密切相关,早期方法依赖于对象检测方法进行自上而下的实例分割或自下而上的处理,最近的方法直接估计每个对象实例的掩码,基线方法使用Mask R - CNN和Mask2Former,使用叶片的全景质量(PQleaf)进行评估,结果表明这些方法在分离叶片方面存在困难,需要更多领域特定的方法来引入先验知识以实现更好的分离。分层全景分割:模型旨在同时对整个对象和每个部分进行实例分割,以提供关于每个对象的更详细信息,例如通过将单个叶片与特定植物相关联来获得每株植物的总叶片数,基线方法选择Weyler等人和Roggiolani等人的方法,使用全景质量(PQ)、作物的PQ(PQcrop)、叶片的PQ(PQleaf)、杂草和土壤的IoU进行评估,结果表明两种方法在大生长阶段的植物预测中不一致,叶片的实例分离具有挑战性,针对这些场景的方法可以提高性能。

结合CVPPA研讨会的挑战

在2023年IEEE/CVF国际计算机视觉会议(ICCV)上举办的计算机视觉在植物表型和农业中的研讨会中,我们邀请社区使用我们的数据集解决分层全景分割这一最具挑战性的任务。我们在CodaLab上收到了来自107名注册参与者的148份提交,对于排行榜上表现最佳的参赛作品,我们邀请作者提供他们方法的技术报告。技术解决方案远远超过了基线,通常使用Segment Anything Model结合检测方法或初始分割并进行改进,基于Mask2Former的方法在小植物上使用掩码细化和在植物掩码上进行第二阶段的叶片实例分割也显示出了有希望的结果。

对其他主题的潜在影响

我们的数据集提供了标记和未标记的图像,有可能影响农业领域的其他研究和应用领域,如自我监督表示学习、域泛化和无监督域适应。结合其他农业数据集,可以研究不同植物物种之间的跨域转移,以开发更通用的农业领域视觉感知系统。

结论

本文提出了一个用于研究农业作物生产中视觉感知的新数据集,包括无人机捕获的真实田间图像以及作物和杂草的密集逐像素注释和作物叶片的逐像素注释。我们提出了基准任务并在隐藏测试集上进行评估,还提供了基线结果,表明某些任务需要进一步研究以应对农业领域的特定挑战,更多利用领域知识的特定领域方法可能会提高性能。

个人总结

这篇论文提出了一个关于农业领域语义图像解释的大型数据集和基准(PhenoBench),并且公开了数据集、代码和基准。目前语义分割、全景分割、实例分割、分层全景分割的农业数据集很少,大型数据集更少。这是该论文很大的亮点。总之,这篇论文是一个不错的工作。

4.Benchmarking Self-Supervised Learning on Diverse Pathology Datasets (2023,CVPR,顶会)

摘要:计算病理学可以挽救人类生命,但模型对标注数据需求大,而病理图像的标注成本极高。自监督学习(SSL)已被证明是利用未标记数据的有效方法,其在病理学中的应用将极大地有益于下游任务。然而,目前还没有原则性的研究来比较SSL方法并讨论如何使其适应病理学。为了满足这一需求,我们迄今为止对病理图像数据上的SSL预训练进行了最大规模的研究。我们的研究使用4种具有代表性的SSL方法在不同的下游任务上进行。我们确定,在标准SSL设置(如线性和微调评估)以及低标签制度下,病理学中大规模的域对齐预训练始终优于ImageNet预训练。此外,我们提出了一组特定领域的技术,实验表明这些技术可以提高性能。首次,我们将SSL应用于细胞核实例分割的具有挑战性的任务,并展示了其在不同评估设置下的巨大且稳定的性能改进。我们发布了预训练模型的权重。

研究背景

对人体组织的显微图像进行计算分析(也称为计算病理学)已成为一个重要的研究课题,其临床应用可以通过改善癌症诊断[49]和治疗[42]来挽救人类生命。病理学中的深度学习和计算机视觉方法允许客观性[15]、大规模分析[20]和分类[5],但通常需要大量的标注数据[52]。然而,病理图像的标注需要具有多年临床经验的专家[37],导致公开标注数据集稀缺,需要有效的方法在这些数据上进行训练。一个常见且实际的解决方案是微调使用ImageNet数据集以监督方式预训练的模型[19, 34]。这种迁移学习的范式[34]最近受到了自监督学习(SSL)的挑战,SSL仅在大量未标记数据上进行训练,但在ImageNet上的性能优于监督预训练[8, 10, 26]。在病理学领域,与标注数据集的缺乏[52]相反,大量未标记数据集是丰富的[4, 37, 38, 57]。如果我们能有效地将SSL应用于这大量的未标记数据,即使下游病理任务包含有限的标注训练数据,也能极大地受益。自然地,我们会问:自监督学习在提高病理任务性能方面的帮助有多大?

ImageNet预训练权重在医学成像中被广泛使用,并且已知有助于获得高任务性能[30, 32, 43, 59]。由于自然图像和医学图像之间的差异,大规模的域对齐预训练有可能将性能推到ImageNet预训练之上[39]。因此,最近的工作表明,在病理数据上进行SSL预训练可以提高下游病理任务的性能[3, 16, 23, 55]。我们的研究旨在通过在不同的下游病理任务上评估多种SSL方法来扩展这些先前的工作。此外,我们提出了一些技术来调整为自然图像数据设计的SSL方法,以便更好地从病理数据中学习。

在本文中,我们对4种最近且具有代表性的SSL方法(MoCo v2 [12]、SwAV [7]、Barlow Twins [61]和DINO [8])应用于大规模病理数据时进行了深入分析。为此,我们从癌症基因组图谱(TCGA)数据集[57]的全切片图像(WSI)中获取了1900万个图像补丁,并应用我们特定领域的技术来训练这些SSL方法。评估在2个不同的下游任务上进行,涉及5个数据集:(1)使用BACH [1]、CRC [31]、MHIST [56]和PatchCamelyon [54]数据集进行病理图像分类,(2)使用CoNSeP数据集[25]进行细胞核实例分割和分类。

我们的大规模研究产生了一些有用的贡献:(a)我们进行了迄今为止病理图像数据上SSL预训练的最大规模研究,并展示了其在不同下游任务上优于使用ImageNet预训练权重的优势(见图1),(b)我们提出了一组精心设计的数据管理和数据增强技术,可以进一步提高下游性能,(c)我们证明了SSL是标签高效的,因此在收集标注特别昂贵的病理学中是一个实际的解决方案,(d)我们首次将SSL应用于细胞核实例分割的密集预测任务,并展示了其在不同评估设置下的价值。我们在https://lunit-io.github.io/research/publications/pathology_ssl上发布我们的预训练模型权重,以进一步为研究社区做出贡献。

相关的工作

自监督学习

SSL方法通过利用从无标签数据本身获得的监督信号设计的 pretext 任务来学习表示。我们将文献中常见的SSL的4种主要范式描述如下。

对比学习

对比方法[27, 40, 41]如SimCLR [10]和MoCo v2 [12]学习将每个训练数据实例与其他所有实例区分开来。目标是学习正对(通过数据增强的扰动)的相似表示和与负对(其他实例)的判别表示。一个限制是需要多样化的负对,这可以通过大批次大小[10]或内存库[12]来缓解。在这项工作中,我们探索MoCo v2 [12]。

非对比学习

方法如BYOL [26]、SimSiam [13]和Barlow Twins [61]与对比学习方法有相似之处,它们在不同的增强视图下学习图像的表示。根本区别在于这些方法不依赖于负对,这允许它们使用小批次大小。在这项工作中,我们探索Barlow Twins [61]。

聚类

这种范式使用聚类的概念,如DeepCluster [6]和SwAV [7]所示。基于聚类的SSL区分图像表示的簇而不是明确的图像对。在这项工作中,我们探索SwAV [7]。使用视觉Transformer的SSL。视觉Transformer(ViT)[21]在各种计算机视觉任务上的有效性已经得到了证明。因此,从CNN到ViT的范式转变最近在自监督学习领域出现。因此,最近的研究[8, 14, 36]试图研究促进基于ViT架构的SSL的技术。在这项工作中,我们探索DINO [8]。

医学成像中的SSL

最近,[39]研究了医学成像中的迁移学习,并观察到使用域对齐的数据集进行预训练可以提高模型的可迁移性。此外,特定领域的SSL方法可以进一步提高在下游医学图像相关任务上微调的模型的性能。在病理学中,[55]使用BYOL并评估从病理数据学习的预训练权重在图像分类任务上的性能。[23]采用SimSiam,表明SSL改善了病理图像检索。最近,[16]使用SimCLR并观察到与ImageNet预训练相比,SSL在下游病理任务上始终有所改进。

与之前专注于单一SSL方法或仅关注CNNs或ViTs的工作不同,我们从上述每个SSL范式中探索一种代表性方法,包括基于ViT的SSL。通过这种方式,我们为在病理学中比较这些方法建立了一个共同且公平的基准。此外,我们在各种下游任务上评估了特定领域的预训练权重,包括具有挑战性的细胞核实例分割任务。最后,我们设计了专门用于应对病理学特定挑战的数据增强技术,从而在下游任务中获得更好的表示和性能。

病理学的自监督预训练

SSL方法的性能可能会根据训练数据的组成和所选的数据增强方法而有很大差异。文献中的SSL方法通常在涉及自然图像的设置中设计和评估,当应用于不同领域(如病理学)时,可能需要进一步调整。在本节中,我们讨论自然图像和病理图像之间的差异。我们还提出了一组可以轻松采用的技术,以提高在病理图像数据上预训练的模型的性能。

与自然图像的差异

流行的计算机视觉数据集(如ImageNet [19])中包含的图像通常被称为“自然图像”。病理图像有几个独特的特征,使其与自然图像不同。我们在本节中讨论这些差异,并在图2中总结。

无标准方向

自然图像中包含的对象或场景基于合理性进行定向,即人类期望对象的定向方式。计算机视觉方法可以利用这种假设或模式(如曼哈顿世界假设[17]),因此SSL方法在训练时不会随机增强图像的方向。然而,病理图像可以以任何方式定向,并且仍然是合理的。此外,对象(如细胞)很多且分散在任意位置,使得无法定义“标准方向”,即正确的标准定向。

颜色变化低

虽然自然图像由于所代表对象的多样性而包含大范围的颜色,但病理图像往往显示出相似的颜色分布(如紫色和粉色染色)。尽管染色在不同机构之间可能会有所不同,并且相同的生物结构根据癌症类型会有不同的外观,但病理图像比自然图像更一致。

不同的FoV

为了正确分析病理图像,必须考虑不同的视野(FoV)。较大的FoV允许病理学家和算法更好地理解组织区域和细胞类别的更大背景,从而做出高级预测,如前列腺癌的分级[4]。在其他需要对单个细胞或细胞群落进行分类的任务中,需要较小的FoV来提高对感兴趣对象的分辨率[25]。因此,病理学前训练模型理想情况下应该能够处理来自不同FoV的任务。

适应SSL用于病理学的技术

在本节中,我们介绍了使SSL方法适应病理图像的技术。主要包括随机垂直翻转、染色增强、以及使用多个FoV。然后介绍了采用这些技术的原因。

实验设置

(不展开了)

实验结果

(不展开了)

讨论

讨论了3个方面。回答了3个问题。在本节中,我们回答了计算病理学研究人员在考虑为他们的研究进行自监督预训练时可能自然会问的几个关键问题。

我们应该在病理数据上进行预训练吗?是的 - 我们通过对许多SSL方法和数据集进行全面实验,始终证明了在病理数据上进行预训练优于在ImageNet上进行监督预训练。有趣的是,SSL预训练权重在CoNSeP上甚至对于更长的训练计划也能保持性能差距。哪种SSL方法是最好的?我们发现没有明确的赢家。所有应用域对齐预训练的SSL方法通常都表现良好。因此,我们建议从业者专注于为SSL预训练策划大规模的域对齐数据集,而不是专注于选择特定的SSL方法。然而,一些初步观察可能对未来的研究有用。例如,(a)Barlow Twins在线性评估中往往表现良好,而MoCo v2在微调评估中表现良好,(b)与CNNs相比,ViTs从域对齐SSL中受益更多。成功的自监督预训练的关键因素是什么?领域知识 - 我们提出的一组技术完全基于病理学中的观察,并且通过实验证明是有效的。通过将特定领域的知识纳入预训练步骤,例如使用染色增强和从多个FoV提取补丁,我们超越了从天真地将SSL应用于新数据集所能获得的性能。

结论和未来工作

在本文中,我们迄今为止在病理学领域对SSL进行了最大规模和最全面的研究,在预训练期间使用了多达3300万个图像补丁,并在2个下游任务和5个数据集上评估了4种具有代表性的SSL方法(包括CNNs和ViTs)。我们的研究证实,大规模的域对齐预训练对病理学有帮助,展示了其在有限标记数据、更长微调计划以及使用更大和更多样化的数据集进行预训练(如TCGA + TULIP)的场景中的价值。

个人总结

这篇论文读下来非常舒服,逻辑性很强,无论是论文的结构以及写作方式都很有参考价值。

5.FieldPlant: A Dataset of Field Plant Images for Plant Disease Detection and Classification With Deep Learning(IEEE Access, IF=3.4)

摘要:在这项研究中,提出了一个名为 FieldPlant 的数据集,其中包括直接从种植园收集的 5,170 张植物病害图像。在植物病理学家的监督下,对每幅图像上的单个叶子进行手动注释,以确保过程质量。这导致了 8,629 个病害类别的 27 片单独注释的叶子。我们在这个数据集上运行了各种基准测试,以评估最先进的分类和对象检测模型,发现 FieldPlant 上的分类任务优于 PlantDoc 上的分类任务。

个人总结

这篇论文参考价值一般,而且数据集规模较小,且没有公开数据集。

6.Paddy Doctor: A Visual Image Dataset for Automated Paddy Disease Classification and Benchmarking (arXiv)

摘要:Paddy Doctor 数据集包含 13 个类别(12 种不同的稻田病害和健康叶片)的 16,225 张标记稻田叶图像。它是最大的由专家注释的视觉图像数据集,用于试验和基准测试计算机视觉算法。水稻叶图像是使用高分辨率(1,080 x 1,440像素)智能手机相机从真实稻田中收集的。在农艺师的帮助下,对收集的图像进行了仔细的清洗和注释。https://paddydoc.github.io 访问稻田医生项目网站了解更多信息。

个人总结

这篇论文介绍了一个水稻病虫害图像数据集,包括了数据的来源和详细信息。这个数据集的主要优点在于其公开性,作者还提到目前正在处理红外图像,期待未来能够进一步公开这些数据。

7. AgriDet: Plant Leaf Disease severity classification using agriculture detection framework(Engineering Applications of Artificial Intelligence,2023, IF=7.5)

摘要:在现代农业领域,植物病害检测在提高作物产量方面起着至关重要的作用。基于图像的技术在植物病害检测研究领域越来越受到关注。然而,由于捕获图像的性质不当,包括导致遮挡、光照、方向和大小问题的不当背景条件,现有方法存在一些问题。此外,在一些实时应用中还会出现成本复杂性、误分类和过拟合问题。为了解决这些问题,我们提出了一种农业检测(AgriDet)框架,该框架结合了传统的 Inception - Visual Geometry Group Network(INC - VGGN)和基于 Kohonen 的深度学习网络,用于检测植物病害并对患病植物的严重程度进行分类。在这个框架中,对图像进行预处理以消除捕获图像中的所有限制。然后,通过提出的多变量 grabcut 算法解决遮挡问题,以实现有效的分割。此外,该框架通过利用改进的基础网络,即预先训练的传统 INC - VGGN 模型,进行准确的病害检测和分类。在这里,预先训练的 INC - VGGN 模型是一个深度卷积神经网络,用于预测植物病害,该模型先前针对独特的数据集进行了训练。将在这个基础网络中预先训练的权重和学习到的特征转移到新开发的神经网络中,以执行我们数据集的植物病害检测特定任务。为了克服过拟合问题,引入了 Dropout 层,并使用 Kohonen 学习层对特征进行深度学习。经过百分比计算,改进的基础网络对训练集中的严重程度类别进行分类。最后,针对不同的性能指标计算框架的性能,并实现比以前模型更高的准确性。此外,验证了统计分析的性能,以在准确性、特异性和敏感性方面证明结果。

个人总结

作者提出了一种农业检测(AgriDet)框架,该框架结合了传统的 INC - VGGN 和基于 Kohonen 的深度学习网络,用于检测植物病害并对患病植物的严重程度进行分类。与其他现有方法相比,AgriDet框架在准确性和损失方面表现更优,能够更准确地学习病害的多尺度特征,减少了误分类。但选择的对比的方法如 INC - VGGN(Chen 等人,2020)、ResNet - 50(He 等人,2016)、VGGNet - 19(Simonyan 和 Zisserman,2015)、DenseNet - 201(Huang 等人,2017)和 Inception V3(Chollet,2017)),我个人认为并不是很新。此外,数据来源于公开数据集,而可用数据集中没有来自实际场景的集成和标记图像,图像是在受控环境中进行训练的。

8. Deep learning based multi-labelled soil classification and empirical estimation toward sustainable agriculture(Engineering Applications of Artificial Intelligence,2023, IF=7.5)

摘要: 农业是印度广大人民的基本职业,也是主要的经济贡献来源。土壤对于为作物提供重要养分及其产量至关重要。确定由粘土、沙子和淤泥颗粒组成的土壤类型,以及它们各自的比例,对于选择合适的作物和识别杂草生长确实具有重要意义。最常用的土壤测定方法是国际移液管法和压力板装置法。在这项研究工作中,我们提出了使用机器学习和深度学习模型进行多类土壤分类的方法,以适当地确定土壤类型,例如多堆叠集成模型和一种新颖的特征选择算法 Q - HOG;因为人工智能已经促进了智能农业的发展。此外,从勘探现场 vridhachalam 收集的图像以及土壤数据集将提高分类精度。考虑了深度学习模型循环神经网络(RNN)、长短期记忆(LSTM)、门控循环单元(GRU)和 VGG16,并对这些不同的深度学习架构以及朴素贝叶斯、KNN、支持向量机等机器学习算法进行了综合评估,并将获得的结果制成表格。提出了一种用于多分类的多堆叠集成模型,该模型采用机器学习和深度学习算法,并通过增加计算时间来评估其性能。在这些模型中,所提出的模型在土壤分类方面表现出色,准确率为 98.96%,精度为 96.14%,召回率为 99.65%,F1 分数为 97.87%。

个人总结

这篇论文的立意是新的。通过搜集不同的土壤类型的图片,来预测土壤的肥力。搜集的图片数量为不到1.4W张图。但是使用的方法,包括引用的方法文献都是相当老的了。数据集也不够大,且没有公开数据集。

9. Evaluating the utility of combining high resolution thermal, multispectral and 3D imagery from unmanned aerial vehicles to monitor water stress in vineyards (Precision Agriculture ,2024, IF=5.585)

摘要:来自无人机(UAV)的高分辨率图像已被确立为进行精确灌溉实践的重要信息来源,对于半干旱地区(如葡萄园)中经常存在的高价值作物尤为相关。许多研究表明,热红外(TIR)传感器在估算冠层温度以了解葡萄生理状态方面的效用,而可见近红外(VNIR)图像和来自红绿蓝(RGB)摄影测量的 3D 点云在更好地监测田间冠层特征以支持农艺实践方面也显示出巨大的潜力。事实上,葡萄树通过一系列生理和生长反应对水分胁迫做出反应,这些反应可能在不同的时空尺度上发生。因此,本研究旨在评估搭载 TIR、VNIR 和 RGB 传感器的无人机在实验葡萄园不同物候期跟踪葡萄水分胁迫的应用。在 2022 年和 2023 年共进行了 12 次无人机飞越,同时收集了原位生理指标(如气孔导度(gs)、叶(Ψleaf)和茎(Ψstem)水势)和冠层特征(如叶面积指数(LAI))。针对原位测量,对线性和非线性模型进行了训练和评估。结果揭示了 TIR 变量在估算生理指标(gs、Ψleaf、Ψstem)方面的重要性,而 VNIR 和 3D 变量对于估算 LAI 至关重要。VNIR 和 3D 变量与水分胁迫指标基本不相关,在训练的经验模型中显示出较低的重要性。然而,使用所有三种变量类型(TIR、VNIR、3D)的模型在跟踪水分胁迫方面始终是最有效的,突出了结合与生理、结构和生长相关的葡萄特征来监测整个葡萄生长期间植被水分状况的优势。本研究强调了结合此类基于无人机的变量来建立与田间水分胁迫指标相关性良好的经验模型的效用,展示了支持农艺实践甚至被纳入基于物理的模型来估算葡萄水分需求和蒸腾作用的巨大潜力。

方法

案例研究和实验设计

为了在案例研究中引起葡萄水分胁迫的大对比和变异性,我们实施了三种处理,分别施加严重亏缺灌溉(0.2Kc;ETo 的 20%)、典型亏缺灌溉(0.4Kc;ETo 的 40%)和高灌溉实践(0.8Kc;ETo 的 80%)。2022 年和 2023 年的灌溉期从 6 月初开始,到 9 月底结束,考虑到每周累积的降雨量和 ETo,每周对三种处理进行灌溉输入调整。2022 年和 2023 年,0.2Kc、0.4Kc 和 0.8Kc 处理的年平均灌溉输入分别为 93 毫米、194 毫米和 371 毫米。在 2022 年和 2023 年共进行了 12 次无人机飞行,同时收集了原位生理指标(如气孔导度(gs)、叶(Ψleaf)和茎(Ψstem)水势)和冠层特征(如叶面积指数(LAI))。针对原位测量,对线性和非线性模型进行了训练和评估。

原位测量

在 2022 年和 2023 年的主要葡萄生长期间(6 月至 8 月)进行了 12 次实地调查,以获取无人机图像和原位葡萄生物物理测量数据。在每次处理的三个重复中,每个重复均匀间隔地设置三个永久采样点(即葡萄藤),每次调查共有 27 个实地测量点。在每次实地调查中,使用 Scholander 压力室模型 600(PMS Instruments,Albany,USA。Scholander 等,1965)和 Licor 的 LAI - 2200C(LI - COR Biosciences USA,2011)分别测量每个采样点的正午叶(Ψleaf)和茎(Ψstem)水势以及叶面积指数(LAI)。仅在 2023 年的调查中,使用 LI - 600 气孔计(LI - COR 型号 600,LI - COR Biosciences,Lincoln,NE)额外获取了气孔导度(gs)的原位测量数据(2022 年该仪器不可用)。此外,在实地记录每个采样葡萄藤的物候生长阶段,遵循扩展的 BBCH 量表(Lorenz 等,1995),并在表 1 中列出每次实地调查的模式值。使用 LAI - 2200C(LI - COR Biosciences USA,2011)进行 LAI 测量时,遵循 White 等(2019)为葡萄园建议的协议。因此,在葡萄藤行下方的每个采样点进行四次测量,然后在距离葡萄藤行 1/4、1/2 和 3/4 距离处进行测量,传感器高度约为地面以上 30 厘米,以避免 LAI - 2200 - C 镜头拦截滴灌线。在这种情况下,将四次测量的平均值获得一个 “生态系统级” LAI,同时考虑葡萄藤和行间(有关 LAI 测量协议的更多详细信息,请参见 White 等,2019)。正午的 Ψleaf、Ψstem 和 gs 与无人机飞越同时在 27 个采样点上进行采集。Ψleaf 和 Ψstem 使用 Scholander 压力室(模型 600)进行采样。对于 Ψleaf,在无人机飞越期间,从每个葡萄藤样品上切下一片发育良好的阳光照射的叶子,Ψstem 样品类似,只是后者在切割前至少一小时用不透明的铝拉链袋覆盖。测量在现场用 Bar 单位进行,但在本研究中转换为 Mpa。同时,使用 LI - 600 气孔计在每个葡萄藤的六个不同叶片样本上测量 gs(三个在上冠层,三个在下冠层)。除了葡萄藤级别的测量外,在实验的东部边缘安装了一个当地气象站(图 1)。该塔配备了来自 Campbell Scientific(IRGASON,Campbell Scientific,Logan,Utah)的集成开放式路径红外气体分析仪和 3D 声波风速仪,用于测量碳、热和水交换,同时还采样气象标量,如气温、湿度和风速,时间步长为半小时。此外,使用四分量净辐射计(SN - 500 - SS,Apogee,Logan,Utah)测量短波和长波辐射。由于该塔于 2022 年 8 月 3 日安装,因此在塔安装之前的调查活动的气象数据从附近的 Chinchón 气象站(距离研究地点约 10 公里)的西班牙灌溉农业气候信息系统(SIAR,https://servicio.mapagob.es/websiar/)获取。SIAR 数据提供每日数据,但通过线性回归模型调整为无人机飞越时间的特定半小时时间步长和当地条件(见图 11),该模型将 Chinchón 气象站的每日气象数据与 El Socorro 实验农场飞越时间的半小时条件相关联(见图 11)。这对于计算地表与空气温度梯度(dT)最为相关,这是本研究中评估的变量之一。表 1 显示了本研究中每次无人机调查使用的气象条件。

无人机载荷和图像处理

使用 DJI Matrice 300 无人机(DJI Technology Co.,Ltd,Shenzhen,China)搭载三种不同的传感器获取可见 - 近红外(VNIR)、热红外(TIR)和 RGB 图像:Parrot Sequoia +(Parrot S.A.,Paris,France)、DJI 的 Zenmuse H20T 和 DJI 的 Zenmuse P1。Sequoia + 相机在绿色(0.48 - 0.52 µm)、红色(0.64 - 0.68 µm)、红边(0.73 - 0.74 µm)和近红外(0.77 - 0.81 µm)光谱区域有四个独立的波段,水平视场角(FOV)为 61.9°,垂直 FOV 为 48.5°。Zenmuse H20T 是一个辐射热微测辐射热计单波段相机,波段范围在 8 - 14 µm,FOV 为 40.6°,而 Zenmuse P1 是一个配备 35 毫米镜头的 RGB 传感器,以 45 兆像素采集图像,可采样非常高分辨率的 RGB 图像。在每次调查中,进行两次飞行。首先,在表面上方 40 米处进行一次飞越,同时获取 VNIR 和 TIR 图像,正面和侧面重叠分别为 70% 和 80%,从而得到大约 4 厘米的原生像素分辨率。其次,在表面上方 15 米处捕获 RGB 图像(正面和侧面重叠也分别为 70% 和 80%),通过摄影测量技术获取密集点云,从而得到正射影像的原生像素分辨率约为 0.2 厘米。无人机图像使用开源摄影测量软件 OpenDroneMap(ODM,https://www.opendronemap.org/)进行处理。原始 TIR H20T 图像瓦片(R - JPEG 格式)首先使用 DJI Thermal SDK 软件(https://www.dji.com/downloads/software/dji - thermal - sdk)转换为单波段辐射温度。然后,这些单独的温度图像瓦片在 ODM 中使用增量结构 - 运动算法和快速近似最近邻(FLANN)匹配器算法进行拼接。同时,使用为 OpenDroneMap 开发的可用例程(https://github.com/OpenDroneMap/ODM/blob/master/opendm/multispectral.py),并遵循 Sequoia(Parrot,2017)的文档,对 Sequoia + 传感器的多光谱图像进行额外的辐射校准,如渐晕、黑电平、增益 / 曝光补偿。RGB 和数字表面模型(DSM)通过 de Castro 等(2018)描述的完全自动处理链生成。

生成和提取无人机变量

利用了每次调查中获取的 TIR、VNIR 和 3D 图像。对于多光谱 VNIR 数据,计算了不同的植被指数(VIs),利用了所有可用的波段组合和那些最常用于监测植被状态的组合。归一化差异植被指数(NDVI)是应用最广泛的 VI,已被证明与植被密度相关(例如 Gitelson,2004)。优化的土壤调整植被指数(OSAVI,Rondeaux 等,1996)被提出用于限制土壤信号对 NDVI 的影响,特别是对于葡萄园等植被成丛种植在行中的低植被覆盖条件。此外,红边反射率已被证明受冠层结构影响较小,对不同作物类型的 LAI 或叶绿素含量等植被特征敏感(Dong 等,2015;Nguy - Robertson & Gitelson,2015)。因此,我们还检查了红边 NDVI(reNDVI,Gitelson & Merzlyak,1994)和绿色叶绿素指数(CIgreen,Gitelson 等,2003),两者在高 LAI 值时都表现出低饱和问题。此外,我们还测试了植被的近红外反射率。

个人总结

这篇论文将大量的生理数据作为实际值(+ 4分),与无人机获取的多种图像预测值(+3 分)进行对比,以此来反映葡萄的干旱预测准确率。工作量挺大的,也有实际意义。这个期刊经常收录无人机拍摄图像+大田实验这种组合的论文。

10. Lesion-aware visual transformer network for Paddy diseases detection in precision agriculture (European Journal of Agronomy,2023,IF=,4.5)

摘要: 精准农业由传感技术和数据分析的进步推动,为解决水稻病害管理中的挑战提供了有前途的解决方案。水稻病害对作物产量和质量有显著的不利影响,因此需要及时准确的检测以进行有效的病害管理。深度学习已显示出从叶片图像中识别植物病害的潜力,包括水稻作物中的病害。然而,不同类型水稻病害之间的细微差异带来了重大的泛化挑战。在这项研究中,我们首次引入了一种病变感知视觉 Transformer,通过识别区分病变特征,实现对水稻叶部病害的准确可靠检测。提出了一种新颖的多尺度上下文特征提取网络,能够在不同尺度和通道上捕获疾病特征的上下文局部和全局表示。然后,提出了一个弱监督的水稻病变定位(PLL)单元,以定位水稻叶片中独特的病变,为模型提供区分性的叶片区域,以指导最终的分类决策。提出了一个特征调整单元,以增强全局和局部潜在空间内关系的建模,从而改善水稻叶片视觉语义之间的空间交换。在公共水稻病害数据集上与最先进的解决方案进行的详尽实验比较表明,我们的系统具有平均 98.74%的准确率和 98.18%的 f1 分数的效率和通用性。

个人总结

这篇论文写的挺好的,读起来比较舒服。论文的结构偏向计算机学,写作风格农学。写作能力+1分,提出了新的检测方法+2分,图像分类方法+1分,总分4分。

相关问答

东北 农业 大学继续教育 论文 成绩怎么查

1、可在学校官网查询。输入考生的学号、姓名、密码就可以找到。2、东北农业大学(NortheastAgriculturalUniversity,NEAU),简称为“东北农大”,位于黑龙江...

华南农业大学 电子 工程学院怎么样?设有哪些专业? 申请方

[回答]~接下来我为大家简单介绍一下我们华南农业大学的电子工程学院开设的专业以及研究情况专业设置:通信工程、电子科学与技术、电子信息工程、电子信息...

农业 推广 论文 的要点?

农业推广论文需要包括以下要点:1)研究问题的明确,例如农业技术、种植方法等;2)论文目的和研究目标的阐述;3)相关文献综述,包括前人研究和相关理论;4...农...

一篇 农业 sci多少字?

一篇农业SCI论文最少要5000字,比较多的可以达到8000字到上万字。一篇农业SCI论文最少要5000字,比较多的可以达到8000字到上万字。

华南 农业 大学毕业 论文 申请条件?

华南农业大学毕业论文的申请条件如下:(1)需要通过所有的课程才可以申请毕业论文。大部分学校还是按照原则的要求来执行,但是也有少部分学校规定如果只剩下最...

农业 方面的 论文 数据怎么找?

可以到国家统计局官方网站查找,也可以查询中国农业经济统计杂志。农业方面有很多的数据在毕业生写论文的时候,往往涉及到某一个区域的数据或者农业某一个行业...

美国 农业 发展求一篇 论文 ,抄的要有水平,审核后追加50分_作业帮

[回答]美国农业发展问题主要表现为农产品生产过剩,价格猛跌,农场和农民收入锐减,农场纷纷破产,农民失业,由此常常引发全面的经济危机.美国农业发展出现的...

东北 农业 大学毕业 论文 上传流程?

论文上传流程一般包括以下步骤:登录东北农业大学教务处网站,进入毕业设计(论文)管理系统。输入用户名和密码,选择毕业设计(论文)提交选项。上传毕业设...

为什么很多 农业 “专家”不到基层调研指导农业?又是怎么写出大量 农业论文 的?

..而现在就有一种社会现象,一些坐在办公室里面的所谓的砖家对一些有实践经验的人指指点点挑毛病,而现实的情况却是这些所谓的砖家甚至连自己学习过的专业的实...

三农工作在实现现代化的重要作用 论文 ?

人为本,谋发展。三农的基础在于人,在于农民,只有有了农民才有农村,才有农业。当前,很多地方的农村出现了“空”的现象,很多的农民因各种因素外出务工,留...三...