智能论文笔记

Pediatric Bone Age Assessment using Deep Learning Models

Aravinda Raman , Sameena Pathan , Tanweer Ali

分类：计算机视觉 | 机器学习

2022-07-20

骨骼年龄评估（BAA）是确定骨骼和年代年龄之间年龄差异的标准方法。手动流程很复杂，需要专家的专业知识。这是深度学习发挥作用的地方。在这项研究中，使用VGG-16，InceptionV3，XceptionNet和Mobilenet等预先训练的模型来评估输入数据的骨骼年龄，并比较并评估其平均平均误差，以查看哪种模型预测最佳。

translated by 谷歌翻译

Assessing the Performance of Automated Prediction and Ranking of Patient Age from Chest X-rays Against Clinicians

Matthew MacPherson , Keerthini Muthuswamy , Ashik Amlani , Charles Hutchinson , Vicky Goh , Giovanni Montana

分类：计算机视觉 | 机器学习

2022-07-04

了解伴随衰老过程的内部生理变化是医学图像解释的重要方面，预期的变化在报告异常发现时起着基线的作用。最近已经证明了深度学习可以准确地从胸部X射线检查患者年龄，并显示出作为健康指标和死亡率预测因素的潜力。在本文中，我们介绍了一项关于放射科医生与最先进的深度学习模型的相对性能的新型比较研究：（a）单个胸部X射线的患者年龄估计，以及（b）排名同一患者的两个时间分离图像。我们使用一个具有1.8m胸部X射线的异质数据库培训模型，其地面真相患者年龄，并研究了有限的培训数据和图像分辨率对模型准确性的限制，并在公共数据上证明了概括性的性能。为了探索模型与人类之间在这些年龄预测任务上的较大性能差距，与文献中看到的其他放射学报告任务相比，我们将我们的年龄预测模型纳入有条件的生成对抗网络（CGAN），允许可视化确定的语义特征通过预测模型对年龄预测很重要，将确定的特征与临床医生依赖的特征进行比较。

translated by 谷歌翻译

Forensic Dental Age Estimation Using Modified Deep Learning Neural Network

Isa Atas , Cuneyt Ozdemir , Musa Atas , Yahya Dogan

分类：计算机视觉

2022-08-21

牙科时代是确定个人年龄的最可靠方法之一。通过使用牙科全景射线照相（DPR）图像，法医科学中的医师和病理学家试图建立没有有效法律记录或注册患者的个人的年代年龄。实践中当前的方法需要密集的劳动，时间和合格的专家。在医学图像处理领域，深度学习算法的发展提高了预测真实价值的敏感性，同时降低了成像时间的处理速度。这项研究提出了一种自动化方法，以使用1,332个DPR图像估算8至68岁的个体的法医年龄。最初，使用基于转移学习的模型进行了实验分析，包括InceptionV3，Densenet201，EdgitionNetB4，MobilenetV2，VGG16和Resnet50V2；因此，修改了表现最好的模型InceptionV3，并开发了新的神经网络模型。减少开发模型体系结构中已经可用的参数数量，从而更快，更准确。所达到的结果的性能指标如下：平均绝对误差（MAE）为3.13，均方根误差（RMSE）为4.77，相关系数r $ $^2 $为87％。可以想象将新模型作为法医学和牙科医学中的潜在可靠和实用的辅助设备。

translated by 谷歌翻译

Detection and Classification of Brain tumors Using Deep Convolutional Neural Networks

Gopinath Balaji , Ranit Sen , Harsh Kirty

分类：计算机视觉 | 神经与进化计算

2022-08-28

由于肿胀和病态增大，人体组织中组织的异常发育被称为肿瘤。它们主要被归类为良性和恶性。大脑中的肿瘤可能是致命的，因为它可能是癌性的，因此可以以附近的健康细胞为食并不断增加大小。这可能会影响大脑中软组织，神经细胞和小血管。因此，有必要以最高的精度在早期阶段检测和分类。脑肿瘤的大小和位置不同，这使得很难理解其性质。由于附近的健康细胞与肿瘤之间的相似性，即使使用先进的MRI（磁共振成像）技术，脑肿瘤的检测和分类过程也可能是一项繁重的任务。在本文中，我们使用Keras和Tensorflow来实施最先进的卷积神经网络（CNN）架构，例如EdgitionNetB0，Resnet50，Xpection，MobilenetV2和VGG16，使用转移学习来检测和分类三种类型的大脑肿瘤，即神经胶质瘤，脑膜瘤和垂体。我们使用的数据集由3264个2-D磁共振图像和4个类组成。由于数据集的尺寸较小，因此使用各种数据增强技术来增加数据集的大小。我们提出的方法不仅包括数据增强，而且还包括各种图像降级技术，头骨剥离，裁剪和偏置校正。在我们提出的工作效率NETB0体系结构中，最佳准确性为97.61％。本文的目的是区分正常和异常像素，并以更好的准确性对它们进行分类。

translated by 谷歌翻译

HTML版本

Human Gender Prediction Based on Deep Transfer Learning from Panoramic Radiograph Images

I. Atas

分类：计算机视觉

2022-05-19

全景牙科射线照相（PDR）图像处理是法医医学中最广泛使用的方法之一。深度学习模型由于其高处理速度，准确性和稳定性而被广泛用于当今放射学图像的自动分析。提出了一些使用转移学习的方法来分类PDR图像。在这项研究中，使用了Densenet121卷积神经网络（CNN）分类器，该分类器是预先训练的深度学习体系结构之一。提出的Densenet121网络已在最后一层之前进行了几层扩展和微调，以提高其从数据中理解更复杂模式的能力。在此阶段结束时，它已经通过包含PDR图像的牙科数据集进行了培训，并变得更有经验。采用了K折的交叉验证方法来提高所提出的Densenet121模型的准确性。在这项研究中，对于4,800个测试数据集的分类精度为97.25％，实现了最佳性能。提出的模型以及基于Grad-CAM的分析还表明，下颌骨和牙齿是性别分类中最重要的领域。

translated by 谷歌翻译

A Comparison Study of Deep CNN Architecture in Detecting of Pneumonia

Al Mohidur Rahman Porag , Md. Mahedi Hasan , Dr. Md Taimur Ahad

分类：计算机视觉 | 机器学习

2022-12-30

Pneumonia, a respiratory infection brought on by bacteria or viruses, affects a large number of people, especially in developing and impoverished countries where high levels of pollution, unclean living conditions, and overcrowding are frequently observed, along with insufficient medical infrastructure. Pleural effusion, a condition in which fluids fill the lung and complicate breathing, is brought on by pneumonia. Early detection of pneumonia is essential for ensuring curative care and boosting survival rates. The approach most usually used to diagnose pneumonia is chest X-ray imaging. The purpose of this work is to develop a method for the automatic diagnosis of bacterial and viral pneumonia in digital x-ray pictures. This article first presents the authors' technique, and then gives a comprehensive report on recent developments in the field of reliable diagnosis of pneumonia. In this study, here tuned a state-of-the-art deep convolutional neural network to classify plant diseases based on images and tested its performance. Deep learning architecture is compared empirically. VGG19, ResNet with 152v2, Resnext101, Seresnet152, Mobilenettv2, and DenseNet with 201 layers are among the architectures tested. Experiment data consists of two groups, sick and healthy X-ray pictures. To take appropriate action against plant diseases as soon as possible, rapid disease identification models are preferred. DenseNet201 has shown no overfitting or performance degradation in our experiments, and its accuracy tends to increase as the number of epochs increases. Further, DenseNet201 achieves state-of-the-art performance with a significantly a smaller number of parameters and within a reasonable computing time. This architecture outperforms the competition in terms of testing accuracy, scoring 95%. Each architecture was trained using Keras, using Theano as the backend.

translated by 谷歌翻译

Terrain Classification using Transfer Learning on Hyperspectral Images: A Comparative study

Uphar Singh , Kumar Saurabh , Neelaksh Trehan , Ranjana Vyas , O. P. Vyas

分类：计算机视觉 | 人工智能 | 机器学习

2022-06-19

与RGB图像相比，高光谱图像包含更多数量的通道，因此包含有关图像中实体的更多信息。卷积神经网络（CNN）和多层感知器（MLP）已被证明是一种有效的图像分类方法。但是，他们遭受了长期培训时间和大量标记数据的要求，以达到预期的结果。在处理高光谱图像时，这些问题变得更加复杂。为了减少训练时间并减少对大型标记数据集的依赖性，我们建议使用转移学习方法。使用PCA将高光谱数据集预处理到较低的维度，然后将深度学习模型应用于分类。然后，转移学习模型使用该模型学到的功能来解决看不见的数据集上的新分类问题。进行了CNN和多个MLP体系结构模型的详细比较，以确定最适合目标的最佳体系结构。结果表明，层的缩放并不总是会导致准确性的提高，但通常会导致过度拟合，并增加训练时间。通过应用转移学习方法而不仅仅是解决问题，训练时间更大程度地减少了。通过直接在大型数据集上训练新模型，而不会影响准确性。

translated by 谷歌翻译

Applying Artificial Intelligence for Age Estimation in Digital Forensic Investigations

Thomas Grubl , Harjinder Singh Lallie

分类：计算机视觉 | 机器学习

2022-01-09

儿童性滥用和剥削（CSAE）受害者的确切年龄估计是最重要的数字取证挑战之一。调查人员通常需要通过查看图像和解释性发展阶段和其他人类特征来确定受害者的年龄。主要优先事项 - 保障儿童 - 通常受到这项工作可能需要的巨大的法医反积云，认知偏见和巨大的心理压力的负面影响。本文评估了现有的面部图像数据集，并提出了一种针对类似数字法医研究贡献的需求而定制的新数据集。这个小型，不同的DataSet为0到20岁的个人包含245个图像，并与FG-Net DataSet的82个唯一图像合并，从而实现了具有高图像分集和低年龄范围密度的327个图像。在IMDB-Wiki DataSet上预先培训的深度期望（DEX）算法测试新数据集。 16至20岁的年轻青少年和年龄较大的青少年/成年人的整体成果非常令人鼓舞 - 达到1.79年的MAE，但也表明0至10岁儿童的准确性需要进一步的工作。为了确定原型的功效，已经考虑了四个数字法医专家的有价值输入，以提高年龄估计结果。需要进一步的研究来扩展关于图像密度的数据集和性别和种族分集等因素的平等分布。

translated by 谷歌翻译

AniWho : A Quick and Accurate Way to Classify Anime Character Faces in Images

Martinus Grady Naftali , Jason Sebastian Sulistyawan , Kelvin Julian , Felix Indra Kurniadi

分类：计算机视觉 | 机器学习

2022-08-23

本文旨在更深入地研究各种可用的模型，包括：InceptionV3，InceptionResnetv2，MobileNetV2和EdgitionNetB7使用转移学习，以对日本动画风格的角色面对面进行分类。本文表明，有效网络-B7的精度率最高，而85.08 \％top-1的精度，其次是MobileNetV2，其准确结果略有较低，但其益处的推理时间较低，所需参数数量较少。本文还使用了一些射击的学习框架，特别是原型网络，该网络可产生不错的结果，可以用作传统转移学习方法的替代方法。

translated by 谷歌翻译

Sky-image-based solar forecasting using deep learning with multi-location data: training models locally, globally or via transfer learning?

Yuhao Nie , Quentin Paletta , Andea Scotta , Luis Martin Pomares , Guillaume Arbod , Sgouris Sgouridis , Joan Lasenby , Adam Brandt

分类：计算机视觉 | 人工智能

2022-11-03

Solar forecasting from ground-based sky images using deep learning models has shown great promise in reducing the uncertainty in solar power generation. One of the biggest challenges for training deep learning models is the availability of labeled datasets. With more and more sky image datasets open sourced in recent years, the development of accurate and reliable solar forecasting methods has seen a huge growth in potential. In this study, we explore three different training strategies for deep-learning-based solar forecasting models by leveraging three heterogeneous datasets collected around the world with drastically different climate patterns. Specifically, we compare the performance of models trained individually based on local datasets (local models) and models trained jointly based on the fusion of multiple datasets from different locations (global models), and we further examine the knowledge transfer from pre-trained solar forecasting models to a new dataset of interest (transfer learning models). The results suggest that the local models work well when deployed locally, but significant errors are observed for the scale of the prediction when applied offsite. The global model can adapt well to individual locations, while the possible increase in training efforts need to be taken into account. Pre-training models on a large and diversified source dataset and transferring to a local target dataset generally achieves superior performance over the other two training strategies. Transfer learning brings the most benefits when there are limited local data. With 80% less training data, it can achieve 1% improvement over the local baseline model trained using the entire dataset. Therefore, we call on the efforts from the solar forecasting community to contribute to a global dataset containing a massive amount of imagery and displaying diversified samples with a range of sky conditions.

translated by 谷歌翻译

Weed Recognition using Deep Learning Techniques on Class-imbalanced Imagery

A S M Mahmudul Hasan , Ferdous Sohel , Dean Diepeveen , Hamid Laga , Michael G. K. Jones

分类：计算机视觉 | 人工智能

2021-12-15

大多数杂草物种都会通过竞争高价值作物所需的营养而产生对农业生产力的不利影响。手动除草对于大型种植区不实用。已经开展了许多研究，为农业作物制定了自动杂草管理系统。在这个过程中，其中一个主要任务是识别图像中的杂草。但是，杂草的认可是一个具有挑战性的任务。它是因为杂草和作物植物的颜色，纹理和形状类似，可以通过成像条件，当记录图像时的成像条件，地理或天气条件进一步加剧。先进的机器学习技术可用于从图像中识别杂草。在本文中，我们调查了五个最先进的深神经网络，即VGG16，Reset-50，Inception-V3，Inception-Resnet-V2和MobileNetv2，并评估其杂草识别的性能。我们使用了多种实验设置和多个数据集合组合。特别是，我们通过组合几个较小的数据集，通过数据增强构成了一个大型DataSet，缓解了类别不平衡，并在基于深度神经网络的基准测试中使用此数据集。我们通过保留预先训练的权重来调查使用转移学习技术来利用作物和杂草数据集的图像提取特征和微调它们。我们发现VGG16比小规模数据集更好地执行，而ResET-50比其他大型数据集上的其他深网络更好地执行。

translated by 谷歌翻译

Covid-19 detection using transfer learning approach from computed temography images

Kenan Mornai , Muhammet Fatih Balikci , Tayfun Yigit Altuntas , Devrim Unay

分类：计算机视觉

2022-07-01

这项研究中我们的主要目标是提出一种基于转移学习的方法，用于从计算机断层扫描（CT）图像中检测。用于任务的转移学习模型是验证的X受感受模型。使用了模型结构和ImageNet上的预训练权重。通过128批量的大小和224x224、3个通道输入图像训练所得的修改模型，并从原始512x512，灰度图像转换。使用的数据集是A COV19-CT-DB。数据集中的标签包括1919年COVID-1919检测的COVID-19病例和非旋转19例。首先，使用数据集的验证分区以及精确召回和宏F1分数的准确性和损失来衡量所提出方法的性能。验证集中的最终宏F1得分超过了基线模型。

translated by 谷歌翻译

Chronological age estimation of lateral cephalometric radiographs with deep learning

Ningtao Liu

分类：计算机视觉 | 机器学习

2021-01-28

传统的手动年龄估计方法是基于多种X射线图像的关键劳动力。一些目前的研究表明，横向头颅（LC）图像可用于估计年龄。然而，这些方法基于手动测量某些图像特征，并根据经验或得分制定年龄估计。因此，这些方法是耗时和劳动密集型的，效果将受主观意见的影响。在这项工作中，我们提出了显着的图增强年龄估计方法，其可以基于LC图像自动执行年龄估计。同时，它还可以显示年龄估计图像中每个区域的重要性，这无疑会增加方法的解释性。我们的方法在4至40岁以上的3014 LC图像上进行了测试。实验结果的MEA是1.250，这少于最先进的基准的结果，因为它在年龄组中表现得更少，数据较少。此外，我们的模型在每个区域培训，在LC图像中的年龄估计的贡献很高，因此验证了这些不同区域对年龄估计任务的影响。因此，我们得出结论，提出的显着性图增强了横向头颅射线照片的时间年龄估计方法可以很好地在时间年龄估计任务中工作，特别是当数据量很小时。此外，与传统深度学习相比，我们的方法也是可解释的。

translated by 谷歌翻译

ALLNet: A Hybrid Convolutional Neural Network to Improve Diagnosis of Acute Lymphocytic Leukemia (ALL) in White Blood Cells

Sai Mattapalli , Rishi Athavale

分类：计算机视觉 | 人工智能 | 机器学习

2021-08-18

由于显微镜水平上的形态相似性，因此在受急性淋巴细胞性白血病（ALL）影响的血细胞之间具有准确和时间敏感的区别，其健康对应物要求使用机器学习体系结构。但是，三种最常见的模型，即VGG，Resnet和Inception，每个模型都有自己的一套缺陷，并具有改进的空间，需要需要出色的模型。拟议的混合卷积神经网络体系结构Allnet由VGG，Resnet和Inception模型的组合组成。 ISBI 2019的所有挑战数据集（此处可用）包含10,691张白细胞的图像，用于训练和测试模型。数据集中的7,272张图像是所有的细胞，其中3,419个是健康的细胞。在图像中，使用60％用于训练模型，将20％用于交叉验证集，而20％用于测试集。 Allnet的表现优于VGG，Resnet和Inception模型，其精度为92.6567％，灵敏度为95.5304％，特异性为85.9155％，AUC分数为0.9666347，F1得分为0.94803。验证集。在测试集中，AllNet的准确度为92.0991％，灵敏度为96.5446％，特异性为82.8035％，AUC得分为0.959972，F1得分为0.942963。在临床工作空间中，Allnet的利用可以更好地治疗成千上万遭受世界各地的人，其中许多是孩子。

translated by 谷歌翻译

Multi-Label Chest X-Ray Classification via Deep Learning

Aravind Sasidharan Pillai

分类：计算机视觉

2022-11-27

In this era of pandemic, the future of healthcare industry has never been more exciting. Artificial intelligence and machine learning (AI & ML) present opportunities to develop solutions that cater for very specific needs within the industry. Deep learning in healthcare had become incredibly powerful for supporting clinics and in transforming patient care in general. Deep learning is increasingly being applied for the detection of clinically important features in the images beyond what can be perceived by the naked human eye. Chest X-ray images are one of the most common clinical method for diagnosing a number of diseases such as pneumonia, lung cancer and many other abnormalities like lesions and fractures. Proper diagnosis of a disease from X-ray images is often challenging task for even expert radiologists and there is a growing need for computerized support systems due to the large amount of information encoded in X-Ray images. The goal of this paper is to develop a lightweight solution to detect 14 different chest conditions from an X ray image. Given an X-ray image as input, our classifier outputs a label vector indicating which of 14 disease classes does the image fall into. Along with the image features, we are also going to use non-image features available in the data such as X-ray view type, age, gender etc. The original study conducted Stanford ML Group is our base line. Original study focuses on predicting 5 diseases. Our aim is to improve upon previous work, expand prediction to 14 diseases and provide insight for future chest radiography research.

translated by 谷歌翻译

Estimation of Acetabular Version from Anteroposterior Pelvic Radiograph Employing Deep Learning

Ata Jodeiri , Hadi Seyedarabi , Fatemeh Shahbazi , Seyed Mohammad Mahdi Hashemi , Seyyedhossein Shafiei

分类：人工智能 | 计算机视觉 | 机器学习

2021-11-14

背景和目的：髋臼版本，总髋关节置换术的必要因素，通过CT扫描作为金标准测量。 CT的辐射剂量和耗材使前后骨盆射线照相适当的替代程序。在这项研究中，我们在前后骨盆X射线上应用了深度学习方法来测量解剖学版本，消除了使用计算机断层扫描的必要性。方法：使用CT图像计算300名患者臀部的右侧和左侧髋臼版角。所提出的深度学习模型，对骨骼时代的预用-VGG16的注意力应用于包括群体的AP图像。这些人的年龄和性别被添加到最后一个完全连接的注意机制层的其他投入。作为输出，预测两个臀部的角度。结果：随着人们更老的，在CT上增加了CT的髋骨角度，男性的平均值为16.54和16.11（右侧和左角度）。使用所提出的深度学习方法估计右侧角度估计的预测错误位于精确的误差区域（<= 3度），显示了所提出的方法在基于AP图像测量解剖学版本的能力。结论：建议算法，在患者骨盆的AP图像上应用预训练的VGG16，其次是考虑年龄和患者性别的注意力模型，可以仅使用AP射线照片准确评估版本，同时避免CT扫描的需要。基于AP盆景的解剖学髋臼版本的应用技术，使用DL方法，迄今为止尚未发布。

translated by 谷歌翻译

An Unsupervised Deep-Learning Method for Bone Age Assessment

Hao Zhu , Wan-Jing Nie , Yue-Jie Hou , Qi-Meng Du , Si-Jing Li , Chi-Chun Zhou

分类：计算机视觉 | 机器学习

2022-06-12

反映骨骼发育程度的骨骼年龄可用于预测成人身高并检测儿童的内分泌疾病。放射科医生的检查和操作员的可变性都对骨龄年龄评估都有重大影响。为了减少人类干预，使用机器学习算法来自动评估骨骼年龄。但是，常规的监督深度学习方法需要预先标记的数据。在本文中，基于具有约束（CCAE）的卷积自动编码器，这是一种在指纹分类中提出的无监督的深度学习模型，我们为骨骼年龄分类并为其施洗Ba-cccae提出了该模型。在拟议的BA-CCAE模型中，骨时代的原始X射线图像的关键区域是编码的，产生了潜在矢量。 K-均值聚类算法用于通过对骨图像的潜在向量进行分组来获得最终分类。一组关于北美儿科骨骼年龄数据集（RSNA）的实验表明，以48个月的间隔分类的准确性为76.15％。尽管现在的准确性低于大多数现有的监督模型，但拟议的BA-CCAE模型可以在没有任何预先标记的数据的情况下建立骨骼年龄的分类，据我们所知，拟议的BA-CCAE是之一使用无监督的深度学习方法进行骨骼年龄评估的少数步道。

translated by 谷歌翻译

Learning Expectation of Label Distribution for Facial Age and Attractiveness Estimation

Bin-Bin Gao , Xin-Xin Liu , Hong-Yu Zhou , Jianxin Wu , Xin Geng

分类：计算机视觉

2020-07-03

使用卷积神经网络，面部属性（例如，年龄和吸引力）估算性能得到了大大提高。然而，现有方法在培训目标和评估度量之间存在不一致，因此它们可能是次优。此外，这些方法始终采用具有大量参数的图像分类或面部识别模型，其携带昂贵的计算成本和存储开销。在本文中，我们首先分析了两种最新方法（排名CNN和DLDL）之间的基本关系，并表明排名方法实际上是隐含的学习标签分布。因此，该结果首先将两个现有的最新方法统一到DLDL框架中。其次，为了减轻不一致和降低资源消耗，我们设计了一种轻量级网络架构，并提出了一个统一的框架，可以共同学习面部属性分发和回归属性值。在面部年龄和吸引力估算任务中都证明了我们的方法的有效性。我们的方法使用单一模型实现新的最先进的结果，使用36美元\倍，参数减少3美元，在面部年龄/吸引力估算上的推动速度为3美元。此外，即使参数的数量进一步降低到0.9m（3.8MB磁盘存储），我们的方法也可以实现与最先进的结果。

translated by 谷歌翻译

MetaAge: Meta-Learning Personalized Age Estimators

Wanhua Li , Jiwen Lu , Abudukelimu Wuerkaixi , Jianjiang Feng , Jie Zhou

分类：计算机视觉

2022-07-12

不同的人以不同的方式衰老。为每个人学习个性化的年龄估计器是年龄估计的有前途的方向，因为它可以更好地建模衰老过程的个性化。但是，由于高级要求，大多数现有的个性化方法都缺乏大规模数据集：身份标签和足够的样本使每个人形成长期衰老模式。在本文中，我们旨在学习没有上述要求的个性化年龄估计量，并提出一种元学习方法，称为年龄估计。与大多数现有的个性化方法不同，这些方法学习了培训集中每个人的个性化估计器的参数，我们的方法将映射从身份信息到年龄估计器参数学习。具体而言，我们引入了个性化的估算器元学习器，该估计量元学习器将身份功能作为输入并输出定制估算器的参数。这样，我们的方法就可以学习元知识而没有上述要求，并无缝将学习的元知识转移到测试集中，这使我们能够利用现有的大规模年龄数据集，而无需任何其他注释。在包括Morph II，Chalearn Lap 2015和Chalearn Lap 2016数据库在内的三个基准数据集上进行的大量实验结果表明，我们的元大大提高了现有的个性化方法的性能，并优于最先进的方法。

translated by 谷歌翻译

CoV-TI-Net: Transferred Initialization with Modified End Layer for COVID-19 Diagnosis

Sadia Khanam , Mohammad Reza Chalak Qazani , Subrota Kumar Mondal , H M Dipu Kabir , Abadhan S. Sabyasachi , Houshyar Asadi , Keshav Kumar , Farzin Tabarsinezhad , Shady Mohamed , Abbas Khorsavi

分类：计算机视觉

2022-09-20

本文提议使用修改的完全连接层转移初始化，以进行1900诊断。卷积神经网络（CNN）在图像分类中取得了显着的结果。但是，由于图像识别应用程序的复杂性，培训高性能模型是一个非常复杂且耗时的过程。另一方面，转移学习是一种相对较新的学习方法，已在许多领域使用，以减少计算来实现良好的性能。在这项研究中，Pytorch预训练的模型（VGG19 \ _bn和WideresNet -101）首次在MNIST数据集中应用于初始化，并具有修改的完全连接的层。先前在Imagenet中对使用的Pytorch预培训模型进行了培训。提出的模型在Kaggle笔记本电脑中得到了开发和验证，并且在网络培训过程中没有花费巨大的计算时间，达到了99.77％的出色精度。我们还将相同的方法应用于SIIM-FISABIO-RSNA COVID-19检测数据集，并达到80.01％的精度。相比之下，以前的方法在训练过程中需要大量的压缩时间才能达到高性能模型。代码可在以下链接上找到：github.com/dipuk0506/spinalnet

translated by 谷歌翻译