智能论文笔记

RADNet: Ensemble Model for Robust Glaucoma Classification in Color Fundus Images

Ahmed Al Mahrooqi , Dmitrii Medvedev , Rand Muhtaseb

分类：人工智能 | 计算机视觉 | 机器学习

2022-05-25

青光眼是最严重的眼部疾病之一，其特征是快速进展，导致不可逆的失明。通常，由于疾病早期缺乏明显的症状，人们的视力已经显着降解时，进行诊断。人口的常规青光眼筛查应改善早期检测，但是，由于手动诊断对有限的专家施加的过多负载，词源检查的理想频率通常是不可行的。考虑到检测青光眼的基本方法是分析视轴与光检查比率的底面图像，机器学习算法可以为图像处理和分类提供复杂的方法。在我们的工作中，我们提出了一种先进的图像预处理技术，并结合了深层分类模型的多视图网络，以对青光眼进行分类。我们的青光眼自动化视网膜检测网络（Gardnet）已在鹿特丹Eyepacs Airogs数据集上成功测试，AUC为0.92，然后在RIM-ONE DL数据集上进行了微调，并在AUC上进行了测试，并在AUC上胜过0.9308的AUC。 - 0.9272。我们的代码将在接受后在GitHub上提供。

translated by 谷歌翻译

Multi-Label Retinal Disease Classification using Transformers

M. A. Rodriguez , H. AlMarzouqi , P. Liatsis

分类：计算机视觉 | 人工智能 | 机器学习

2022-07-05

早期发现视网膜疾病是预防患者部分或永久失明的最重要手段之一。在这项研究中，提出了一种新型的多标签分类系统，用于使用从各种来源收集的眼底图像来检测多种视网膜疾病。首先，使用许多公开可用的数据集来构建一个新的多标签视网膜疾病数据集，即梅里德数据集。接下来，应用了一系列后处理步骤，以确保图像数据的质量和数据集中存在的疾病范围。在眼底多标签疾病分类中，首次通过大量实验优化的基于变压器的模型用于图像分析和决策。进行了许多实验以优化所提出的系统的配置。结果表明，在疾病检测和疾病分类方面，该方法的性能比在同一任务上的最先进作品要好7.9％和8.1％。获得的结果进一步支持了基于变压器的架构在医学成像领域的潜在应用。

translated by 谷歌翻译

An Ensemble Method to Automatically Grade Diabetic Retinopathy with Optical Coherence Tomography Angiography Images

Yuhan Zheng , Fuping Wu , Bartłomiej W. Papież

分类：计算机视觉

2022-12-12

Diabetic retinopathy (DR) is a complication of diabetes, and one of the major causes of vision impairment in the global population. As the early-stage manifestation of DR is usually very mild and hard to detect, an accurate diagnosis via eye-screening is clinically important to prevent vision loss at later stages. In this work, we propose an ensemble method to automatically grade DR using ultra-wide optical coherence tomography angiography (UW-OCTA) images available from Diabetic Retinopathy Analysis Challenge (DRAC) 2022. First, we adopt the state-of-the-art classification networks, i.e., ResNet, DenseNet, EfficientNet, and VGG, and train them to grade UW-OCTA images with different splits of the available dataset. Ultimately, we obtain 25 models, of which, the top 16 models are selected and ensembled to generate the final predictions. During the training process, we also investigate the multi-task learning strategy, and add an auxiliary classification task, the Image Quality Assessment, to improve the model performance. Our final ensemble model achieved a quadratic weighted kappa (QWK) of 0.9346 and an Area Under Curve (AUC) of 0.9766 on the internal testing dataset, and the QWK of 0.839 and the AUC of 0.8978 on the DRAC challenge testing dataset.

translated by 谷歌翻译

Deep learning for understanding multilabel imbalanced Chest X-ray datasets

Helena Liz , Javier Huertas-Tato , Manuel Sánchez-Montañés , Javier Del Ser , David Camacho

分类：计算机视觉 | 机器学习

2022-07-28

在过去的几年中，卷积神经网络（CNN）占据了计算机视野的领域，这要归功于它们提取功能及其在分类问题中出色的表现，例如在自动分析X射线中。不幸的是，这些神经网络被认为是黑盒算法，即不可能了解该算法如何实现最终结果。要将这些算法应用于不同领域并测试方法论的工作原理，我们需要使用可解释的AI技术。医学领域的大多数工作都集中在二进制或多类分类问题上。但是，在许多现实生活中，例如胸部X射线射线，可以同时出现不同疾病的放射学迹象。这引起了所谓的“多标签分类问题”。这些任务的缺点是类不平衡，即不同的标签没有相同数量的样本。本文的主要贡献是一种深度学习方法，用于不平衡的多标签胸部X射线数据集。它为当前未充分利用的Padchest数据集建立了基线，并基于热图建立了可解释的AI技术。该技术还包括概率和模型间匹配。我们系统的结果很有希望，尤其是考虑到使用的标签数量。此外，热图与预期区域相匹配，即它们标志着专家将用来做出决定的区域。

translated by 谷歌翻译

Contrastive learning-based pretraining improves representation and transferability of diabetic retinopathy classification models

Minhaj Nur Alam , Rikiya Yamashita , Vignav Ramesh , Tejas Prabhune , Jennifer I. Lim , R. V. P. Chan , Joelle Hallak , Theodore Leng , Daniel Rubin

分类：计算机视觉

2022-08-24

基于自我监督的基于学习的预科可以使用小标签的数据集开发可靠和广义的深度学习模型，从而减轻了标签生成的负担。本文旨在评估基于CL的预处理对可转介的性能与非转介糖尿病性视网膜病（DR）分类的影响。我们已经开发了一个基于CL的框架，具有神经风格转移（NST）增强，以生成具有更好表示和初始化的模型，以检测颜色底面图像中的DR。我们将CL预估计的模型性能与用成像网权重预测的两个最先进的基线模型进行了比较。我们通过减少标记的训练数据（降至10％）进一步研究模型性能，以测试使用小标签数据集训练模型的鲁棒性。该模型在EYEPACS数据集上进行了培训和验证，并根据芝加哥伊利诺伊大学（UIC）的临床数据进行了独立测试。与基线模型相比，我们的CL预处理的基础网模型具有更高的AUC（CI）值（0.91（0.898至0.930），在UIC数据上为0.80（0.783至0.820）和0.83（0.783至0.820）（0.801至0.853）。在10％标记的培训数据时，在UIC数据集上测试时，基线模型中的FoldusNet AUC为0.81（0.78至0.84），比0.58（0.56至0.64）和0.63（0.56至0.64）和0.63（0.60至0.66）。基于CL的NST预处理可显着提高DL分类性能，帮助模型良好（可从Eyepacs转移到UIC数据），并允许使用小的带注释的数据集进行培训，从而减少临床医生的地面真相注释负担。

translated by 谷歌翻译

Breast Cancer Diagnosis in Two-View Mammography Using End-to-End Trained EfficientNet-Based Convolutional Network

Daniel G. P. Petrini , Carlos Shimizu , Rosimeire A. Roela , Gabriel V. Valente , Maria A. A. K. Folgueira , Hae Yong Kim

分类：计算机视觉

2021-10-01

最近的一些研究描述了深层卷积神经网络，以诊断与人类专家相似甚至卓越表现的乳腺癌乳腺癌。最好的技术之一可以进行两种转移学习：第一个使用在自然图像上训练的模型来创建“补丁分类器”，该模型将小型子图表分类；第二个使用补丁分类器来扫描整个乳房X线照片并创建“单视图全图分类器”。我们建议进行第三次转移学习，以获取“两视图分类器”，以使用两种乳房X线摄影视图：双侧颅颅和中外侧倾斜。我们使用效率网络作为模型的基础。我们使用CBIS-DDSM数据集“端到端”训练整个系统。为了确保统计鲁棒性，我们使用以下方式两次测试系统，（a）5倍交叉验证；（b）数据集的原始培训/测试部门。我们的技术使用5倍的交叉验证达到0.9344的AUC（在ROC的误差率相等的误差率下，准确性，灵敏度和特异性为85.13％）。据我们所知，使用原始的数据集除法，我们的技术达到了0.8483，尽管我们知道的最高的AUC在此问题上，尽管每项工作的测试条件上的细微差异不允许进行准确的比较。推理代码和模型可在https://github.com/dpetrini/two-views-classifier上获得

translated by 谷歌翻译

Less is More: Lighter and Faster Deep Neural Architecture for Tomato Leaf Disease Classification

Sabbir Ahmed , Md. Bakhtiar Hasan , Tasnim Ahmed , Redwan Karim Sony , Md. Hasanul Kabir

分类：计算机视觉 | 机器学习

2021-09-06

为了确保全球粮食安全和利益相关者的总体利润，正确检测和分类植物疾病的重要性至关重要。在这方面，基于深度学习的图像分类的出现引入了大量解决方案。但是，这些解决方案在低端设备中的适用性需要快速，准确和计算廉价的系统。这项工作提出了一种基于轻巧的转移学习方法，用于从番茄叶中检测疾病。它利用一种有效的预处理方法来增强具有照明校正的叶片图像，以改善分类。我们的系统使用组合模型来提取功能，该模型由预审计的MobilenETV2体系结构和分类器网络组成，以进行有效的预测。传统的增强方法被运行时的增加取代，以避免数据泄漏并解决类不平衡问题。来自PlantVillage数据集的番茄叶图像的评估表明，所提出的体系结构可实现99.30％的精度，型号大小为9.60mb和4.87亿个浮点操作，使其成为低端设备中现实生活的合适选择。我们的代码和型号可在https://github.com/redwankarimsony/project-tomato中找到。

translated by 谷歌翻译

Assessing Coarse-to-Fine Deep Learning Models for Optic Disc and Cup Segmentation in Fundus Images

Eugenia Moris , Nicolás Dazeo , Maria Paula Albina de Rueda , Francisco Filizzola , Nicolás Iannuzzo , Danila Nejamkin , Kevin Wignall , Mercedes Leguía , Ignacio Larrabide , José Ignacio Orlando

分类：计算机视觉

2022-09-28

底面图像中的自动化视盘（OD）和光杯（OC）分割与有效测量垂直杯盘比率（VCDR）是一种在眼科中常用的生物标志物，以确定胶状神经神经病变的程度。通常，这是使用粗到1的深度学习算法来解决的，其中第一阶段近似于OD，第二阶段使用该区域的作物来预测OD/OC掩码。尽管这种方法广泛应用于文献中，但尚无研究来分析其对结果的真正贡献。在本文中，我们介绍了使用5个公共数据库的不同粗到精细设计的全面分析，包括从标准分割的角度以及估算青光眼评估的VCDR。我们的分析表明，这些算法不一定超过标准的多级单阶段模型，尤其是当这些算法是从足够大而多样化的训练集中学习的。此外，我们注意到粗糙阶段比精细的OD分割结果更好，并且在第二阶段提供OD监督对于确保准确的OC掩码至关重要。此外，在多数据集设置上训练的单阶段和两阶段模型都表现出对成对的结果，甚至比其他最先进的替代方案更好，同时排名第一的OD/OC分段。最后，我们评估了VCDR预测的模型与Airogs图像子集中的六个眼科医生相比，以在观察者间可变性的背景下理解它们。我们注意到，即使从单阶段和粗至细节模型中恢复的VCDR估计值也可以获得良好的青光眼检测结果，即使它们与专家的手动测量不高度相关。

translated by 谷歌翻译

Fully Automated 2D and 3D Convolutional Neural Networks Pipeline for Video Segmentation and Myocardial Infarction Detection in Echocardiography

Oumaima Hamila , Sheela Ramanna , Christopher J. Henry , Serkan Kiranyaz , Ridha Hamila , Rashid Mazhar , Tahir Hamid

分类：计算机视觉 | 机器学习

2021-03-26

被称为超声心动图的心脏成像是一种非侵入性工具，用于生成包括图像和视频的数据，心脏病专家用来诊断心脏异常，尤其是心肌梗死（MI）。超声心动图机可以提供大量数据，需要由心脏病专家快速分析，以帮助他们做出诊断和治疗心脏病。但是，获得的数据质量取决于购置条件以及患者对设置说明的响应能力。这些限制对医生的挑战尤其是当患者面对MI并且他们的生命受到威胁时。在本文中，我们提出了一种基于卷积神经网络（CNN）的创新实时端到端全自动模型，以根据由左心室（LV）的区域壁运动异常（RWMA）检测到MI，该模型是由左心室（LV）的视频中的。超声心动图。我们的模型是由2D CNN组成的管道实现Mi。我们在由165个超声心动图视频组成的数据集上培训了两个CNN，每个CNN从一个独特的患者中获得。 2D CNN在数据分割方面达到了97.18％的精度，而3D CNN获得了90.9％的精度，100％的精度和95％的召回率。我们的结果表明，创建一个完全自动化的MI检测系统是可行且有利的。

translated by 谷歌翻译

REFUGE2 Challenge: A Treasure Trove for Multi-Dimension Analysis and Evaluation in Glaucoma Screening

Huihui Fang , Fei Li , Junde Wu , Huazhu Fu , Xu Sun , Jaemin Son , Shuang Yu , Menglu Zhang , Chenglang Yuan , Cheng Bian

分类：计算机视觉

2022-02-18

With the rapid development of artificial intelligence (AI) in medical image processing, deep learning in color fundus photography (CFP) analysis is also evolving. Although there are some open-source, labeled datasets of CFPs in the ophthalmology community, large-scale datasets for screening only have labels of disease categories, and datasets with annotations of fundus structures are usually small in size. In addition, labeling standards are not uniform across datasets, and there is no clear information on the acquisition device. Here we release a multi-annotation, multi-quality, and multi-device color fundus image dataset for glaucoma analysis on an original challenge -- Retinal Fundus Glaucoma Challenge 2nd Edition (REFUGE2). The REFUGE2 dataset contains 2000 color fundus images with annotations of glaucoma classification, optic disc/cup segmentation, as well as fovea localization. Meanwhile, the REFUGE2 challenge sets three sub-tasks of automatic glaucoma diagnosis and fundus structure analysis and provides an online evaluation framework. Based on the characteristics of multi-device and multi-quality data, some methods with strong generalizations are provided in the challenge to make the predictions more robust. This shows that REFUGE2 brings attention to the characteristics of real-world multi-domain data, bridging the gap between scientific research and clinical application.

translated by 谷歌翻译

HEROHE Challenge: assessing HER2 status in breast cancer without immunohistochemistry or in situ hybridization

Eduardo Conde-Sousa , João Vale , Ming Feng , Kele Xu , Yin Wang , Vincenzo Della Mea , David La Barbera , Ehsan Montahaei , Mahdieh Soleymani Baghshah , Andreas Turzynski

分类：计算机视觉

2021-11-08

乳腺癌是女性最常见的恶性肿瘤，每年负责超过50万人死亡。因此，早期和准确的诊断至关重要。人类专业知识是诊断和正确分类乳腺癌并定义适当的治疗，这取决于评价不同生物标志物如跨膜蛋白受体HER2的表达。该评估需要几个步骤，包括免疫组织化学或原位杂交等特殊技术，以评估HER2状态。通过降低诊断中的步骤和人类偏差的次数的目标，赫洛挑战是组织的，作为第16届欧洲数字病理大会的并行事件，旨在自动化仅基于苏木精和曙红染色的HER2地位的评估侵袭性乳腺癌的组织样本。评估HER2状态的方法是在全球21个团队中提出的，并通过一些提议的方法实现了潜在的观点，以推进最先进的。

translated by 谷歌翻译

Computer Vision on X-ray Data in Industrial Production and Security Applications: A survey

Mehdi Rafiei , Jenni Raitoharju , Alexandros Iosifidis

分类：计算机视觉

2022-11-10

X-ray imaging technology has been used for decades in clinical tasks to reveal the internal condition of different organs, and in recent years, it has become more common in other areas such as industry, security, and geography. The recent development of computer vision and machine learning techniques has also made it easier to automatically process X-ray images and several machine learning-based object (anomaly) detection, classification, and segmentation methods have been recently employed in X-ray image analysis. Due to the high potential of deep learning in related image processing applications, it has been used in most of the studies. This survey reviews the recent research on using computer vision and machine learning for X-ray analysis in industrial production and security applications and covers the applications, techniques, evaluation metrics, datasets, and performance comparison of those techniques on publicly available datasets. We also highlight some drawbacks in the published research and give recommendations for future research in computer vision-based X-ray analysis.

translated by 谷歌翻译

Construction material classification on imbalanced datasets using Vision Transformer (ViT) architecture

Maryam Soleymani , Mahdi Bonyani , Hadi Mahami , Farnad Nasirzadeh

分类：计算机视觉

2021-08-21

这项研究提出了一个可靠的模型，用于识别具有最高精度的不同建筑材料，该模型被利用为用于广泛的施工应用（例如自动进度监控）的有利工具。在这项研究中，一种称为视觉变压器（VIT）的新型深度学习结构用于检测和分类建筑材料。使用不同的图像数据集评估了所采用方法的鲁棒性。为此，对模型进行了训练和测试，并在两个大型不平衡数据集上进行了测试，即建筑材料库（CML）和建筑材料数据集（BMD）。还通过组合CML和BMD来创建更不平衡的数据集并评估使用方法的功能来生成第三个数据集。所达到的结果揭示了评估指标的精度为100％，例如三个不同数据集的每个材料类别的准确性，精度，召回率和F1得分。据信，建议的模型实现了用于检测和分类不同材料类型的强大工具。迄今为止，许多研究试图自动对仍然存在一些错误的各种建筑材料进行分类。这项研究将解决上述缺点，并提出一个模型以更高的精度检测材料类型。所采用的模型也能够被推广到不同的数据集。

translated by 谷歌翻译

Stain Normalized Breast Histopathology Image Recognition using Convolutional Neural Networks for Cancer Detection

Sruthi Krishna , Suganthi S. S , Shivsubramani Krishnamoorthy , Arnav Bhavsar

分类：计算机视觉

2022-01-04

计算机辅助诊断数字病理学正在变得普遍存在，因为它可以提供更有效和客观的医疗保健诊断。最近的进展表明，卷积神经网络（CNN）架构是一种完善的深度学习范式，可用于设计一种用于乳腺癌检测的计算机辅助诊断（CAD）系统。然而，探索了污染变异性因污染变异性和染色常规化的影响，尚未得到很好的挑战。此外，对于高吞吐量筛选可能是重要的网络模型的性能分析，这也不适用于高吞吐量筛查，也不熟悉。要解决这一挑战，我们考虑了一些当代CNN模型，用于涉及（1）的乳房组织病理学图像的二进制分类。使用基于自适应颜色解卷积（ACD）的颜色归一化算法来处理污染归一化图像的数据以处理染色变量; （2）应用基于转移学习的一些可动性更高效的CNN模型的培训，即视觉几何组网络（VGG16），MobileNet和效率网络。我们在公开的Brankhis数据集上验证了培训的CNN网络，适用于200倍和400x放大的组织病理学图像。实验分析表明，大多数情况下预染额网络在数据增强乳房组织病理学图像中产生更好的质量，而不是污染归一化的情况。此外，我们使用污染标准化图像评估了流行轻量级网络的性能和效率，并发现在测试精度和F1分数方面，高效网络优于VGG16和MOBILENET。我们观察到在测试时间方面的效率比其他网络更好; vgg net，mobilenet，在分类准确性下没有太大降低。

translated by 谷歌翻译

Is the aspect ratio of cells important in deep learning? A robust comparison of deep learning methods for multi-scale cytopathology cell image classification: from convolutional neural networks to visual transformers

Wanli Liu , Chen Li , Md Mamunur Rahamana , Tao Jiang , Hongzan Sun , Xiangchen Wu , Weiming Hu , Haoyuan Chen , Changhao Sun , Yudong Yao

分类：计算机视觉

2021-05-16

宫颈癌是女性中一种非常常见和致命的癌症类型。细胞病理学图像通常用于筛选这种癌症。鉴于在手动筛查期间可能发生许多错误，已经开发了一种基于深度学习的计算机辅助诊断系统。深度学习方法需要输入图像的固定维度，但临床医学图像的尺寸不一致。图像的纵横比在直接调整它们的同时受到影响。临床上，细胞病理学图像内的细胞的纵横比为医生诊断癌症提供重要信息。因此，很难直接调整大小。然而，许多现有研究直接调整了图像的大小，并获得了高度稳健的分类结果。为了确定合理的解释，我们进行了一系列比较实验。首先，预处理SipakMed数据集的原始数据以获得标准和缩放数据集。然后，将数据集调整为224 x 224像素。最后，22种深度学习模型用于分类标准和缩放数据集。该研究的结果表明，深度学习模型对宫颈细胞病理学图像中细胞的纵横比变化是鲁棒的。此结论也通过Herlev DataSet验证。

translated by 谷歌翻译

Deep Learning based Framework for Automatic Diagnosis of Glaucoma based on analysis of Focal Notching in the Optic Nerve Head

Sneha Dasgupta , Rishav Mukherjee , Kaushik Dutta , Anindya Sen

分类：计算机视觉

2021-12-10

视网膜眼底图像的自动评估是涌现为最重要的早期检测和治疗渐进眼疾病的工具之一。青光眼导致视力的进步退化，其特征在于光学杯形状的变形和血管的变性导致沿神经垂体边缘形成凹口的形成。在本文中，我们提出了一种基于深度学习的管道，用于从数字眼底图像（DFIS）的光盘（OD）和光学杯（OC）区域的自动分割，从而提取预测青光眼所需的不同特征。该方法利用了神经古代轮辋的局灶性凹口分析以及杯盘比值值作为分类参数，以提高计算机辅助设计（CAD）系统的准确性分析青光眼。支持基于向量的机器学习算法用于分类，基于提取的功能将DFIS分类为青光眼或正常。在自由可用的DRISHTI-GS数据集上评估了所提出的管道，得到了从DFIS检测青光眼的93.33％的精度。

translated by 谷歌翻译

Automating Detection of Papilledema in Pediatric Fundus Images with Explainable Machine Learning

Kleanthis Avramidis , Mohammad Rostami , Melinda Chang , Shrikanth Narayanan

分类：机器学习

2022-07-10

乳头乳头瘤菌是一种眼科神经系统疾病，其中颅内压的增加会导致视神经肿胀。儿童中未诊断的乳头毛症可能导致失明，可能是威胁生命的疾病（例如脑肿瘤）的标志。使用深度学习对眼底图像的自动分析可以促进这种综合征的稳健临床诊断，尤其是在存在伪造症带来的挑战的情况下，具有相似的眼睛外观，但具有明显的临床意义。我们提出了一种基于学习的算法，用于自动检测小儿乳头毛瘤。我们的方法是基于视盘定位和通过数据增强来检测可解释的乳头毛指标。现实世界中临床数据的实验表明，我们提出的方法具有与专家眼科医生相当的诊断精度有效。

translated by 谷歌翻译

The Prominence of Artificial Intelligence in COVID-19

MD Abdullah Al Nasim , Aditi Dhali , Faria Afrin , Noshin Tasnim Zaman , Nazmul Karim

分类：机器学习 | 人工智能

2021-11-18

2019年12月，一个名为Covid-19的新型病毒导致了迄今为止的巨大因果关系。与新的冠状病毒的战斗在西班牙语流感后令人振奋和恐怖。虽然前线医生和医学研究人员在控制高度典型病毒的传播方面取得了重大进展，但技术也证明了在战斗中的重要性。此外，许多医疗应用中已采用人工智能，以诊断许多疾病，甚至陷入困境的经验丰富的医生。因此，本调查纸探讨了提议的方法，可以提前援助医生和研究人员，廉价的疾病诊断方法。大多数发展中国家难以使用传统方式进行测试，但机器和深度学习可以采用显着的方式。另一方面，对不同类型的医学图像的访问已经激励了研究人员。结果，提出了一种庞大的技术数量。本文首先详细调了人工智能域中传统方法的背景知识。在此之后，我们会收集常用的数据集及其用例日期。此外，我们还显示了采用深入学习的机器学习的研究人员的百分比。因此，我们对这种情况进行了彻底的分析。最后，在研究挑战中，我们详细阐述了Covid-19研究中面临的问题，我们解决了我们的理解，以建立一个明亮健康的环境。

translated by 谷歌翻译

Diabetic Foot Ulcer Grand Challenge 2021: Evaluation and Summary

Bill Cassidy , Connah Kendrick , Neil D. Reeves , Joseph M. Pappachan , Claire O'Shea , David G. Armstrong , Moi Hoon Yap

分类：计算机视觉 | 机器学习

2021-11-19

糖尿病足溃疡分类系统使用伤口感染（伤口内的细菌）和缺血（限制血供给）作为重要的临床指标治疗和预测伤口愈合。研究使用自动化计算机化方法在糖尿病足伤中使用自动化计算机化方法的使用和缺血的使用是有限的，这是有限的，因为存在的公开可用数据集和严重数据不平衡存在。糖尿病脚溃疡挑战2021提供了一种具有更大量数据集的参与者，其总共包括15,683只糖尿病足溃疡贴剂，用于训练5,734，用于测试，额外的3,994个未标记的贴片，以促进半监督和弱的发展 - 监督深度学习技巧。本文提供了对糖尿病足溃疡攻击2021中使用的方法的评估，并总结了从每个网络获得的结果。最佳性能的网络是前3种型号的结果的集合，宏观平均F1分数为0.6307。

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译