banner

ニュース

Aug 31, 2023

松の実の分類における機械学習の応用

Scientific Reports volume 12、記事番号: 8799 (2022) この記事を引用

1128 アクセス

2 引用

2 オルトメトリック

メトリクスの詳細

松の実は、松の再生と植林に重要な役割を果たしているだけでなく、栄養価の高いナッツとして一般的に消費されています。 しかし、松の実は種間で形態が類似しているため、区別するのは困難です。 したがって、松の実の品質を向上させ、異物混入の問題を迅速かつ非破壊的に解決することが重要です。 この研究では、7 種類の松の実 (バンゲアナ マツ、ユンナネンシス マツ、ツンベルギ マツ、アルマンディ マツ、マソニアナ マツ、エリオッティ マツ、タイワネンシス マツ) を研究種として使用しました。 7 種の松の実、5 つの機械学習手法 (ディシジョン ツリー (DT)、ランダム フォレスト (RF)、多層パーセプトロン (MLP)、サポート ベクター マシン (SVM)、およびナイーブ ベイズ) から 210 個の近赤外 (NIR) スペクトルが収集されました。 (NB)) は松の実の種類を識別するために使用されました。 303 枚の画像を使用して形態学的データを収集し、5 つの畳み込みニューラル ネットワーク (CNN) モデル (VGG16、VGG19、Xception、InceptionV3、および ResNet50) に基づく分類モデルを構築しました。 NIR 分光法の実験結果は、最良の分類モデルは MLP であり、精度が 0.99 に近いことを示しています。 画像の別の実験結果は、最良の分類モデルが InceptionV3 であり、精度が 0.964 に近いことを示しています。 4 つの重要な波長帯、951 ~ 957 nm、1,147 ~ 1,154 nm、1,907 ~ 1,927 nm、2,227 ~ 2,254 nm は、松の実の分類と高度に関連していることが判明しました。 この研究は、機械学習が松の実の分類に効果的であり、さまざまな種類の松の実を迅速かつ非破壊で正確に分類するためのソリューションと科学的方法を提供することを示しています。

正式に認められているリンマツの種は 113 種以上あり、主に北半球に分布しており 1,2 、森林生態系の重要な部分を形成しています。 松の実は松の木の種子であり、一般的に消費されるナッツであり、植林と生殖の重要な要素です3。 松の実には、タンパク質、脂肪酸、ミネラル、ビタミンが豊富に含まれています。 また、心血管疾患の予防を促進するオレイン酸、リノレン酸、その他の不飽和脂肪酸も含まれています4。 松の実の種の認識は、食品の安全性と松の実の品質にとって重要です。 近年、松の実の価格高騰により、大きな経済効果がもたらされています。 2020年から2021年の世界の松の実の生産量は約381,700トンです。 中国は世界の松の実の主要な輸出入国です。 松の実の見た目の類似性を考慮すると、製品に異物が混入している可能性が非常に高く、異物混入問題は健康や経済に大きな影響を及ぼします。 したがって、松の実中の異物混入物を、便利かつ迅速かつ非破壊的な方法で検出する方法は、松の実の食品安全性に対する課題です。

現在、種を識別する一般的な方法には、形態学的分析 5、分子マーカー技術 6、7、8、9、タンパク質電気泳動 10、液体クロマトグラフィー 11、スペクトル分析 12、13、14、および画像認識 15 が含まれます。 形態学的分析には高度な専門知識が必要ですが、これを容易に習得することはできません。そのため、一部の種間の形態学的類似性が大きいため、正確な識別率は低くなります16。 分子マーカーを使用すると、より高い認識率と精度が得られますが、これは破壊的な方法論であり、時間がかかり、公開データベースで公開されているマーカーの数によって制限されます。 したがって、この研究では、近赤外 (NIR) 分光法と画像に基づいて松の実を分類するための機械学習モデルを確立します。

NIR 分光法は、材料内の赤外スペクトルの分子振動を利用する方法論です。 NIR 分光法のプロセスには、サンプルに入る赤外光を放射する NIR 装置が含まれます。 ここで、光は反射、屈折、拡散、吸収され、最終的にサンプル情報を検出器に戻します。 この方法は便利で、迅速で、非破壊的で、費用対効果が高くなります。 これは、小麦 17、大豆 18、ササゲ 19、米 12 の生産の研究など、多くの農業分野で使用されています。 これまでのところ、林業や松の実の研究における NIR 分光法の応用に関する報告はほとんどありません。 具体的には、Tigabu et al.20 は、さまざまな地域でアカマツのナッツの可視近赤外スペクトル データを収集し、乗算散乱補正 (MSC) によってスペクトル データを前処理しました。 ナッツ ソースは、クラス類推のソフト独立モデリング (SIMCA) および部分最小二乗判別分析 (PLS-DA) を通じて構築されました。 Loewe ら 21 は、分類のためにチリの農園から地中海マツの NIR スペクトル データを収集しました。 Moscetti et al.22 は、さまざまな地域で P. pinea と Pinus sibirica の堅果の NIR スペクトル データを収集し、PLS-DA および Interval PLS-DA (IPLS-DA) 法を使用してスペクトル分類モデルを確立しました。 ただし、他の異なる分類モデルの影響については、より多くの種類の松の実についてさらに議論する必要があります。

画像に基づく機械学習は、イネ害虫の識別 23、デンドロリムス・プンクタトゥス・ウォーカーの被害検出 24、その他の農林分野への応用に成功しています。 機械学習の一種であるディープラーニングでは、階層分析とマルチレベル計算を使用して結果を取得します。 ディープ畳み込みニューラル ネットワーク (CNN) は、トマトのペスト認識 25 や魚の画像認識 26 などのアプリケーションの画像認識に適用され、成功しています。 Moscetti et al.22 は、異なる地域の P. pinea と P. sibirica の堅果の画像データを収集し、特徴抽出を実行して、画像データに基づいて 10 個の特徴を取得し、これらの特徴を使用して画像ベースの分類モデルを構築しました。 松の実分類の実現可能性は手動で抽出された画像特徴に基づいて証明されていますが、自動分類モデルはさらに多くの種類の松の実についてさらに研究する価値があります。

したがって、現代のコンピューター技術を使用して松の実を分類することにより、松の実を非破壊で迅速かつ正確に分類する研究が大幅に促進されます。 本研究では機械学習技術を採用し、松の実の分類における機械学習の応用可能性を検証する。 現在の研究の貢献は次のとおりです。(1) 松の実の種を識別するために分子マーカーが使用されました。 (2) 7 種類の松の実 (2 種類の食用松の実 (Pinus bungeana および Pinus armandii) と 5 つの一般的な種 (Pinus yunnanensis、Pinus thunbergii、Pinus Massoniana、Pinus elliottii、Pinus taiwanensis)) の近赤外分光法および画像を収集しました。 (3) NIR 分光法では分類に 5 つの機械学習手法が使用され、画像認識では 5 つの CNN モデルが選択されます。 この研究は、松の実の分類における機械学習の可能性を検証し、松の実の種をより迅速かつ非破壊で正確に識別するための実用的な方法を提供します。

組み立てられた ITS2 および rbcL 配列は、GenBank データベース (https://www.ncbi.nlm.nih.gov/search/all/?term=blast) と比較することによって分子マーカーに使用されました。 表 1 は、ITS2 配列の長さが 477 ~ 482 bp の範囲であるのに対し、rbcL 遺伝子の長さは 677 ~ 720 bp の範囲であることを示しています (表 2)。 GenBank アクセッション番号は OK274058 ~ OK274066 および OK271114 ~ OK271122 です。 その結果、P. Massoniana、P. armandii、P. thunbergii、および P. bungeana は認識されましたが、P. taiwanensis (同義語は Pinus hwangshanensis) は認識されませんでした。 P. yunnanensis と P. elliottii の ITS2 遺伝子配列と比較すると、GenBank には同じ種はありませんでした。 ITS2 と rbcL が一部の松の実の種認識に適した分子マーカーであることは明らかですが、分子解析は GenBank で公的に入手可能なデータによって制限されています。 その後、中国科学院昆明植物研究所に相談し、松の実種の信頼性と信頼性を確認するためにラベルを再度作成しました。

収集された松の実のNIRスペクトルが分析され、図1に示されています。すべての元のNIRスペクトル(図1a)から、7つの松の実のNIRスペクトルの振幅、山、谷が同様の変化をしていることが明らかです。 このうち、P. armandii の値は全範囲に比べて高い位置(最も高い吸光度値を示す)にあり、P. Massoniana の値は低い位置にある。 正規化されたNIRスペクトル(図1b)は、各松の実のNIRスペクトルが正規化後により明確になり、松の実の値間の変化がより明確に観察できることを示しています。 このうち、P. armandii と P. bungeana は 9,000 ~ 4,000 cm-1 (1,111 ~ 2,500 nm) の範囲で高度に混合されています。

松の実の近赤外スペクトルデータ。 (a) 元の NIR スペクトルのすべて。 (b) 正規化された NIR スペクトル。R は反射率を表し、log(1/R) は吸光度を表します。 垂直の直線ストライプは、10,506.29 ~ 10,452.29 cm-1、8712.813 ~ 8658.815 cm-1、5241.572 ~ 5187.575 cm-1、および 4489.471 ~ 4435.474 cm-1 (951 ~ 957 nm、1,147 ~ 1,154 cm-1) の感度バンドを表します。 nm、1,907–1,927 nm 、2,227–2,254 nm) を移動するスライディング ウィンドウによって選択します。

5 つの従来の機械学習モデル、つまりデシジョン ツリー (DT)、ランダム フォレスト (RF)、多層パーセプトロン (MLP)、サポート ベクター マシン (SVM)、ナイーブベイズ (NB) (表 3)。 表 3 から、これらのモデルを使用した松の実の分類が効果的であることが明らかです。 データが正規化されていない場合、DT および RF 分類モデルの精度は 0.83 より大きくなります。 正規化されたデータの場合、5 つのモデルの分類精度は > 0.80 で、MLP と SVM では > 0.93 の精度が得られます。 データの前処理により、MLP モデルと SVM モデルのパフォーマンスが大幅に向上し、MLP モデルの精度は 0.99 に達し、SVM モデルは 0.94 に達しました。 全体として、これらの結果は、データが正規化されていない場合には RF モデルがより優れた分類方法であるのに対し、正規化されたデータには MLP モデルが最適であることを示しています。

精度 (Pre) および F1 スコア (F1) を表 4 (正規化されていないデータ) および表 5 (正規化されたデータ) に示します。 表 4 では、P. armandii と P. bungeana の精度と F1 スコアがより高く、P. bungeana の精度が最も高く、0.97 に達します。 ただし、P. taiwanensis と P. Massoniana の精度と F1 スコアは非常に低く、それぞれ 18% と 22% の精度スコアに達します。 図 1a では、P. armandii と P. bungeana の区別は明確ですが、P. taiwanensis と P. Massoniana はそれほど明確ではないため、分類がより困難です。 ただし、表 5 は、7 種類の松の実の精度と F1 スコアが正規化後に大幅に改善されたことを示しています。 これは、データの正規化がスペクトル データ処理に必要なステップであることを示しています。

image_clip (クリップされた画像)、image_trans (変換された画像)、および image_gray (グレースケール変換された画像) のデータセットに対して 3 つの前処理メソッドが実行されました。 image_clip データは、元のデータに対する深層学習モデルの結果を調べるために使用されます。image_trans と image_gray は、image_clip 変換を拡張することによって取得されます。 VGG16、VGG19、Xception、ResNet50、および InceptionV3 モデルを 100 エポックのオプションで選択し、精度と損失を評価指標として使用しました。 図 2、3、および 4 は、トレーニングおよび検証された 5 つのモデルの精度と損失の値を示しています。 これらの図から、Xception と InceptionV3 は、VGG16、VGG19、および ResNet50 モデルと比較して、最高の精度と最低の損失で最高のパフォーマンスを示します。 さらに、3 つの前処理方法の中で、image_trans は image_gray および image_clip よりも優れたパフォーマンスを発揮します。 したがって、Xception および InceptionV3 モデルは松の実の画像ベースの分類に最適であり、画像は変換する必要がありますが、グレースケールに設定する必要はありません (表 6)。

image_clip データを使用した 5 つの異なるモデルの精度と損失。

image_trans データを使用した 5 つの異なるモデルの精度と損失。

image_gray データを使用した 5 つの異なるモデルの精度と損失。

これまでの研究では、マツ属は白亜紀前期(1億1600万年から8300万年前)に起源を持ち、2つの亜属(P.massoniana、P.thunbergii、P.yunnanensis、P.taiwanensis、P.massonianaなど)とStrobusに分岐したことが示されている。 (P. armandii や P. bungeana など)2, 27. 長い進化の歴史の中で、プレートの移動、海と陸の移動、気候変動などの多くの出来事を経験した可能性があります2, 28, 29. 植物の化学組成器官は、進化の長い過程における植物と環境との相互作用の結果です30、31、32。 我々の結果は、Strobus 亜属の P. armandii 種と P. bungeana 種が、他の 5 種のマツ亜属よりも 9,000 ~ 4,000 cm-1 (1,111 ~ 2,500 nm) の領域で高いバンドを持っていることを示唆しました (図 1)。 これらのバンドは、以前の研究でタンパク質、アミノ酸、水分、脂質、炭水化物と関連していることが判明しました20、22。注目すべきことに、我々の結果では、3つの感度の高いバンド(1,147~1,154 nm、1,907~1,927 nm、2,227~2,254 nm)も存在することが示されました。これらの領域 (1,111 ~ 2,500 nm) の波長は、スライディング ウィンドウ法に基づくモデルの精度に大きな影響を与えます (図 1)。 マツ亜属とは異なり、ストロバス亜属の種 P. armandii および P. bungeana は主に中国北部に分布していました(表 S1)。 一部の物質の違いは、標高、年間平均気温、土壌の特性、降水量、日照など、特定の地理的分布や環境条件によって引き起こされる可能性があります22。 種子分類における SVM、RF、PLS-DA 法に基づく以前の研究 12、18 と比較すると、MLP モデルが優れたパフォーマンスを示すことが私たちの結果で示されました。これは、収集された NIR スペクトルが化学物質の違いによりモデルに対する感度が異なることを説明できます。コンポーネント。

また、松の実の画像の 2 つの亜属の間にいくつかの形態的な違いも見つかりました。 Strobus 亜属の種子はおそらく Pinus 亜属よりも滑らかな形状と質感を持っており (図 7)、これは機械学習モデルの特徴抽出に役立つと考えられます。 以前の研究では、PLS-DA モデルと IPLS-DA モデルが 2 つの種の複数の品種を認識するのに良好な結果を達成したことが示されています22。 ただし、私たちの結果は、InceptionV3 モデルが 7 種の松の実の画像に対して最も高速な収束速度と最高の精度で最高のパフォーマンスを発揮したことを示唆しています。 同様のモデルは、イネの栄養欠乏の診断 33 や複数の雑草種の分類にうまく使用できることがわかりました 34。 複数のモデルの認識精度の違いは、データセット間のナッツの形態学的特徴 (形状、色、質感) に関連している可能性があります。

分子マーカー、NIR、画像の 3 つの認識方法には、それぞれ異なる利点があります (図 5)。 精度の点では、分子マーカーは NIR や画像よりも認識率が高くなります。 しかし、分子標識には長い時間がかかり、実験装置や公的参照データベースによって制限されます。 コストの観点からは、画像解析の方が便利で速く、環境の制約を受けないため良いかもしれませんが、この方法では大量の画像が必要となり、認識率が低くなります。 パフォーマンスの点では、認識率が高く、生成されるデータ量が少ないため、NIR 分光法の方が優れている可能性がありますが、コストが高く、特別な装置が必要です。 将来的には、より多くの種に対して分子、NIR、画像の複数の特徴を統合することでアンサンブル学習アプローチを活用する予定です。

分析コスト、複雑さ、パフォーマンスのレーダー チャート。 時間: 分析に必要な時間。 コスト: 分析を完了するための財務コスト。 制限: 実験条件の制限要因の程度。 データ容量: 分析から得られるデータの量。 精度: 識別の正確さ。 ここでのスケールは値を表し、0 は最低値を示し、1.0 は最高値を示します。

現在の研究結果に基づいて、この研究では、NIR分光法と画像に基づく機械学習モデルの、異なる種の松の実間の認識への応用の可能性を検証します。 研究対象として7種の松の実を収集し、近赤外分光法と画像データに基づいて分類モデルを構築した。 さまざまなモデルと比較して、MLP と InceptionV3 はより優れた分類効果を達成することが証明されました。 同時に、NIR の感度バンドは、官能基のいくつかの特殊な分子振動との相関を示します。 この結果は、松の実のさまざまな種を便利かつ迅速かつ非破壊的に分類するための解決策と科学的方法を提供し、種分類の分野における新しいアイデアと、参考となる方法論的および技術的スキームを提供します。

松の実の収集と研究に対する学術的な許可は、教育省南西林業大学南西山林資源保護利用重要研究室の所長によって与えられました。 この研究は関連するすべてのガイドラインを満たしていました。

P. bungeana の研究に使用 | Junying Jiao 01 |、P. armandii | 中国科学院昆明植物研究所、ZuoZh271 |、P. yunnanensis | 中国科学院昆明植物研究所、MY259|、P. thunbergia | 中国科学院昆明植物研究所、Lilan898 |、P. Massoniana | 中国科学院昆明植物研究所、LWY2020020 |、P. elliottii | Junying Jiao 02 |および P. taiwanensis | 中国科学院昆明植物研究所、Jiangxc0597 | これらは、昆明植物研究所、中国科学院、雲南省森林苗木ワークステーション準備プラントから調製されました。 この研究で使用された松の実は、教育省南西林業大学林業大学の南西山岳地帯森林資源保全・利用重点研究室所長Junying Jiao氏によって正式に特定された。 P. bungeana と P. elliottii は、コード アクセス番号: 0000651 および 0,000,652 で南西林業大学の植物標本館に登録および保存されています。 P. armandi、P. yunnanensis、P. thunbergia、P. Massoniana、および P. taiwanensis は、コード アクセス番号: ZuoZh271、MY259、Lilan898、LWY2020020 で、中国科学院昆明植物研究所の生殖細胞質バンクに登録および保存されました。そしてJiangxc0597。

各種から約 1.5 kg のナッツが選択され、画像および NIR 分光分析のための前処理が行われました。 種子の表面を蒸留水ですすぎ、欠陥のあるナッツを取り除きました。 次に、洗浄した松の実をオーブン (モデル DHG-9245A、Shanghai Hengke Instrument Co., Ltd.、上海、中国) で 40 °C で 8 時間乾燥させました。 前処理の後、ナッツは、その後の NIR スペクトルの取得のために 30 のグループにランダムに分割されました。 各グループから 1 つまたは 2 つのナッツを撮影して、元の画像を取得しました (表 7)。

松の実の種を同定するために、以前の研究で既知の配列に基づいて ITS2 および rbcL のプライマーが設計されました 35 (表 8)。 断片遺伝子の位置を特定し、ABI 3730 シーケンサーを使用して配列決定しました。 SeqMan ツールを使用して、重複するフラグメントを組み立てました。

NIRスペクトルは、拡散積分球を備えたInGaAs検出器、7.78cmの石英サンプリングカップ、および12,800〜3,800cmの範囲内のサンプル回転テーブルを備えたAntaris Fourier Transform NIR分光計(Thermo Fisher Scientific、マサチューセッツ州、米国)を使用して取得しました。 1(781 nm〜2632 nm)、解像度8 cm−1。 サンプルは 48 回スキャンされ、2335 個のバンドが得られました。 データは、吸光度を表すためにlog(1/R)を使用して変換されました。

NIR スペクトルは、外れ値によって引き起こされる悪影響を排除するために、最小-最大正規化法を使用して正規化されました。 元のデータは、式 1 を使用して 0 から 1 の範囲に正規化されました。 (1)。

ここで、x は吸光度の値を表し、min(x) と max(x) はそれぞれ最低吸光度および最高吸光度を表します。

松の実の画像は、オート フォーカスとマニュアル フォーカスをサポートする 40 MP 超高感度カメラ (広角、f/1.8) を搭載した Huawei Mate 30 携帯電話を介して、白い背景と 8 倍の倍率で LEICA EZ4 顕微鏡を使用して撮影されました。 撮影角度は 90°、高さは 50 cm に設定し、松の実の種類ごとに 52 枚の画像を撮影しました。

画像を取得するプロセス中に不規則性が生じます。 これには、松の実の大きさのばらつき、位置の不一致、色の出現などが含まれ、これらすべてが認識モデルと分類の精度に影響を与えます。 したがって、標準化のための画像の前処理には、次の 2 つの手順が含まれます。

(1) エッジ検出とクリッピング

松の実の端の位置は、OpenCV プラットフォーム上の Sobel メソッドを使用して検出されました。 シードの上下左右の頂点が定義されると、4 つの頂点を接続するマトリックス フレームを通じて画像が切り取られます (図 6)。 均一な画像背景を維持するために (図 6d)、さらに手動で切断する必要がある場合がありました (図 6e)。

ソーベルエッジ検出とクリッピングプロセス。

(2) データ拡張と画像グレースケール

クリップされた画像は、OpenCV の「反転」機能と「サイズ変更」機能を使用して方向が調整されました。 式 (2) を使用して、これらの位置合わせされた画像をグレースケール画像に変換しました (図 7)。 この研究では、OpenCV の色変換関数 CV_BGR2GRAY を使用して、画像のグレースケール処理を実行しました。

各種の松の実の画像前処理の結果。 画像は切り取られ、反転され、サイズ変更され、グレースケールに色変換されています。

松の実の分類モデルをさらに研究するために、2 つの実験的アプローチが採用されました (図 8)。 最初のアプローチには、NIR 分光法に基づいてナッツを分類するために使用される、DT、RF、MLP、SVM、NB などの従来の機械学習手法が含まれていました。 NIRスペクトルに基づく分類モデルには5つのステップが含まれています(図8a)。 データは最初に準備され、次に 8:2 の比率に従ってトレーニング セットと検証セットに分割されました。 次に、DT、RF、MLP、SVM、NB 学習方法を使用して分類モデルを確立しました。 トレーニングと検証の後、精度 (Acc)、Pre、および F1 が各分類モデルのパフォーマンス評価指標として選択されました。

画像認識と近赤外分光法の実験設計プロセス。 (a) NIR 分光データを使用した従来の機械学習分類モデル確立のプロセス。 (b) 画像データを使用した深層学習分類モデルの構築プロセス。

2 番目のアプローチである 5 つの CNN モデル (VGG16、VGG19、Xception、InceptionV3、および ResNet50) が構築され、松の実の画像を分類するためにトレーニングされました (図 8b)。 まず、データセット内の元の画像のサイズが異なっていました。 実験前に、元の画像を前処理して 224 × 224 サイズにカットしました。 次に、松の実の画像を 8:2 の比率に従ってトレーニング セットと検証セットに分割しました。 次に、VGG16、VGG19、Xception、ResNet50、および InceptionV3 モデルがトレーニングと検証のために実験プラットフォームにロードされました。 エポックは 100 回に設定され、確率的勾配降下法 (SGD) 最適化手法が採用され、初期学習率は 0.005 に設定されました。 学習率はトレーニング ターンごとに変化し、1 ターンあたり 1e-6 の減衰があり、運動量パラメーターは 0.9 に設定されました。 損失関数は sparse_categorical_crossentropy、活性化関数は Rectified Linear Units (ReLU) でした。 最後に、Acc、Pre、および F1 がモデル評価用に選択されました。

これら 2 つの実験的アプローチは、異なるモデルのパフォーマンスを比較および分析して、どちらが将来の松の実の分類研究に最も役立つかを評価するために設計されました。 CNN モデルは、Python v.3.7 で実行される Python ライブラリ Keras-nightly 2.6.0、TensorFlow-nightly-GPU 2.6.0、Scikit-learn 0.24.2 を使用して構築されました。

この研究で提示されたデータとコードは、https://github.com/SWFU-JiangLiu/Recognition-of-pine-nuts.git で入手できます。 GenBank アクセッション番号は OK271114 ~ OK271122 および OK274058 ~ OK274066 です。

Gernandt、DS、Lopez、GG、Garcia、SO & Liston、A. マツの系統発生と分類。 Taxon 54、29–42 (2005)。

記事 Google Scholar

ジン、WT 他系統発生学的および生態学的分析により、世界のマツの時空間進化が明らかになります。 手順国立アカド。 科学。 米国 https://doi.org/10.1073/pnas.2022302118 (2021)。

記事 PubMed PubMed Central Google Scholar

Wang, Y. 栄養価の高いドライフルーツと松の実。 山西省旧58、58(2016年)。

郭、X。病気を取り除くための冬の松の実。 緑と暮らし 44, 44 (2014)

Zhu, D. et al. レーザー光後方散乱イメージングによる単一大豆種子品種の識別。 レット上院議員。 10、399–404 (2012)。

記事 Google Scholar

Zhang、C.ら。 市販ハイブリッド大豆 (Glycine max L.) の純度試験のための SSR マーカーの応用。 J.アグリック. 科学。 テクノロジー。 16、1389–1396 (2014)。

Google スカラー

Iqbal, A.、Sadaqat, HA、Khan, AS & Amjad, M. 単純配列反復マーカーを使用したヒマワリ (Helianthus annuus、キク科) 雑種の同定。 ジュネット。 モル。 解像度 10、102–106。 https://doi.org/10.4238/vol10-1gmr918 (2011)。

論文 CAS PubMed Google Scholar

オリベイラ・デ・オリベイラ、L. 他 Carya isllinoinensis (Juglandaceae) の分子マーカー: 遺伝的特性評価から分子育種まで。 J.ホーティック. 科学。 バイオテクノロジー。 96、560–569。 https://doi.org/10.1080/14620316.2021.1892534 (2021)。

記事 CAS Google Scholar

Pandit, R.、Travadi, T.、Sharma, S.、Joshi, C. & Joshi, M. rbcL ベースのミニバーコードを使用した DNA メタバーコーディングにより、アーユルヴェーダの多草薬処方中に不特定の植物種が存在することが明らかになりました。 フィトケム。 アナル。 32、804–810。 https://doi.org/10.1002/pca.3026 (2021)。

論文 CAS PubMed Google Scholar

ラオ、P.ら。 可溶性種子タンパク質の化学試験とゲル電気泳動によるイネ (Oryza sativa) の品種識別。 インドのJ.アグリック。 科学。 82、304–311 (2012)。

CAS Google スカラー

Peng、Z.ら。 変性高速液体クロマトグラフィーを米の品種識別と種子の純度評価に応用。 モル。 繁殖。 https://doi.org/10.1007/s11032-015-0429-8 (2016)。

記事 Google Scholar

Kong, W.、Zhang, C.、Liu, F.、Nie, P. & He, Y. 近赤外ハイパースペクトル イメージングと多変量データ解析を使用したイネ種子品種の同定。 センサー (バーゼル) 13、8916 ~ 8927。 https://doi.org/10.3390/s130708916 (2013)。

記事 ADS Google Scholar

Yang, X.、Hong, H.、You, Z. & Cheng, F. ワキシー コーン種子品種分類のためのハイパースペクトル データのスペクトルと画像の統合分析。 センサー (バーゼル) 15、15578–15594。 https://doi.org/10.3390/s150715578 (2015)。

記事 ADS Google Scholar

Liu, J.、Li, Z.、Hu, F.、Chen, T.、Zhu, A. GA-SVM に基づくトランスジェニック綿種子の THz 分光法非破壊識別法。 オプション。 量的。 電子。 47、313–322。 https://doi.org/10.1007/s11082-014-9914-2 (2014)。

記事 CAS Google Scholar

Pourreza、A.、Pourreza、H.、Abbaspour-Fard、M.-H. & Sadrnia, H. 画像処理による組織分析によるイラン産小麦種子 9 品種の同定。 計算します。 電子。 農業。 83、102–108。 https://doi.org/10.1016/j.compag.2012.02.005 (2012)。

記事 Google Scholar

ボールト、B.ら。 マルチスペクトル イメージング - 種子の品質評価における新しいツール? シードサイエンス。 解像度 28、222–228。 https://doi.org/10.1017/s0960258518000235 (2018)。

記事 Google Scholar

Kandala, CVK、Govindarajan, KN、Puppala, N.、Settaluri, V. & Reddy, RS フィッシャーの線形判別分析を使用した平行平板静電容量センサーによる小麦品種の識別。 J. Sens. 1–5、2014. https://doi.org/10.1155/2014/691898 (2014)。

記事 Google Scholar

Zhu, S. et al. 大豆種子の品種を識別するための迅速かつ高効率な方法: 転移学習と組み合わせたハイパースペクトル画像。 分子 25、152。https://doi.org/10.3390/molecules25010152 (2019)。

論文 CAS PubMed Central Google Scholar

ElMasry、G. et al. ササゲ (Vigna unguiculata) の種子を分類するためのコンピューター ビジョンとマルチスペクトル イメージング技術の利用。 植物法 15、24。 https://doi.org/10.1186/s13007-019-0411-2 (2019)。

記事 PubMed PubMed Central Google Scholar

Tigabu, M.、Oden, PC & Lindgren, D. 可視近赤外反射スペクトルと多変量解析を使用した、アカマツの種子源と親の同定。 木 19、468–476。 https://doi.org/10.1007/s00468-005-0408-​​5 (2005)。

記事 Google Scholar

Loewe Munoz, V.、Balzarini, M.、Delard Rodriguez, C.、Alvarez Contreras, A. & Navarro-Cerrillo, RM チリ中央部のヨーロッパ原産のハイマツ (Pinus pinea L.) の成長。 iForest Biogeosci。 のために。 10、64–6 https://doi.org/10.3832/ifor1984-009 (2017)。

記事 Google Scholar

モセッティ、R. et al. NIR分光法と画像解析を使用した松の実の種認識。 J.食品工学 292、110357。https://doi.org/10.1016/j.jfoodeng.2020.110357 (2021)。

記事 CAS Google Scholar

Shi, J.、Liu, Z.、Zhang, L.、Zhou, W. & Huang, J. 稲葉ローラーベースの 013 サポート ベクター マシンによって損傷した稲のハイパースペクトル認識。 顎。 J.ライスサイエンス。 23、331–334 (2009)。

CAS Google スカラー

Xu、Z.ら。 フィッシャー判別分析とランダム フォレストに基づいた Dendrolimus punctatus ウォーカーのダメージ検出。 分光器。 スペクトルアナル。 38、2888–2896 (2018)。

CAS Google スカラー

Rangarajan, AK、Purushothaman, R. & Ramesh, A. 事前トレーニング済みの深層学習アルゴリズムを使用したトマト作物の病気分類。 プロセディアコンピューティング。 科学。 133、1040–1047 (2018)。

記事 Google Scholar

Hridayami, P.、IKGD プトラ & カンザス州ウィバワ VGG16 深層畳み込みニューラル ネットワークを使用した魚種認識。 J.Comput. 科学。 工学 13、124–130。 https://doi.org/10.5626/jcse.2019.13.3.124 (2019)。

記事 Google Scholar

Zhao、YJ、Cao、Y.、Wang、J.、Xiong、Z. Pinus kesiya var. のトランスクリプトーム配列決定 langbianensis とマツの系統発生における比較分析。 BMC Genomics 19、725。https://doi.org/10.1186/s12864-018-5127-6 (2018)。

論文 CAS PubMed PubMed Central Google Scholar

Herold, N.、You, Y.、Müller, RD & Seton, M. 中新世の古地形の変化に対する気候モデルの感度。 オーストラル。 J. アース サイエンス 56、1049–1059。 https://doi.org/10.1080/08120090903246170 (2009)。

記事 ADS CAS Google Scholar

ゴロンカ、J. et al. 北極の古地理的復元と盆地の開発。 3月ペット。 ゲオル。 20、211–248。 https://doi.org/10.1016/s0264-8172(03)00043-6 (2003)。

記事 Google Scholar

フィダン、H. et al. ニグラアカマツの化学組成。 ブルガリア産の未熟な種子。 植物 https://doi.org/10.3390/plants11030245 (2022)。

記事 PubMed PubMed Central Google Scholar

Sahin、U.、Anapali、O.、Ercisli、S. 園芸で使用されるいくつかの基質の物理化学的特性。 ユーロ。 J.ホーティック. 科学。 67、55–60 (2002)。

CAS Google スカラー

リュー、W.ら。 Potentilla fruticosa L. の活性物質生成と抗酸化活性に対する環境要因の影響とその品質評価。 科学。 議員番号 6、28591。https://doi.org/10.1038/srep28591 (2016)。

論文 ADS CAS PubMed PubMed Central Google Scholar

Xu、Z.ら。 ディープ畳み込みニューラル ネットワークを使用して、イネの栄養素欠乏を画像ベースで診断します。 計算します。 知性。 神経科学。 2020、7307252。https://doi.org/10.1155/2020/7307252 (2020)。

記事 PubMed PubMed Central Google Scholar

オルセン、A.ら。 DeepWeeds: 深層学習用のマルチクラス雑草種画像データセット。 科学。 議員9、2058年。https://doi.org/10.1038/s41598-018-38343-3 (2019)。

論文 ADS CAS PubMed PubMed Central Google Scholar

ゴン、H.ら。 松葉の顕微鏡的および分子的同定。 J.浙江大学 (Med. Sci.) 47、300–306 (2018)。

Google スカラー

リファレンスをダウンロードする

この作品は雲南卓耀科技会社の支援を受けています。

この研究は、国立自然科学財団 (31960142) のプロジェクトによって支援されました。 中国南西部山脈の森林資源の保全と利用に関する主要研究所、教育省(KLESWFU-201905)、雲南省教育局科学研究財団(2022Y559)、生物資源のデジタル化、開発、応用(202002AA10007)。

これらの著者、Biaosheng Huang と Jiang Liu も同様に貢献しました。

西南林業大学ビッグデータおよびインテリジェントエンジニアリング大学、昆明、650224、雲南省、中国

Biaosheng Huang、Jiang Liu、Jing Lu、Danjv Lv、Jiawei Mao、Youjie Zhao

中国南西部山脈における森林資源の保全と利用に関する主要研究所、教育省、西南林業大学、昆明、650224、雲南省、中国

ホアン・ビアオシェン & チャオ・ヨウジエ

西南林業大学林業大学、昆明、650224、雲南省、中国

ジャオ・ジュンイン

西南林業大学数学物理学部、昆明、650224、雲南、中国

ヤン・チャン

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

PubMed Google Scholar でこの著者を検索することもできます

BSH と JL (Jiang Liu) はこの研究を企画し、主要な原稿テキストを執筆しました。 JYJは松の実を買って保管していました。 JL (Jing Lu) と JWM はデータを収集し、データを分析し、数値を作成しました。 YJZ と YZ は結果の解釈を支援しました。 DJL、YJZ、YZ が言語の編集に役立ちました。 著者全員が結果の解釈と原稿の執筆に貢献しました。

Youjie Zhao または Yan Zhang への通信。

著者らは競合する利害関係を宣言していません。

シュプリンガー ネイチャーは、発行された地図および所属機関における管轄権の主張に関して中立を保ちます。

オープン アクセス この記事はクリエイティブ コモンズ表示 4.0 国際ライセンスに基づいてライセンスされており、元の著者と情報源に適切なクレジットを表示する限り、あらゆる媒体または形式での使用、共有、翻案、配布、複製が許可されます。クリエイティブ コモンズ ライセンスへのリンクを提供し、変更が加えられたかどうかを示します。 この記事内の画像またはその他のサードパーティ素材は、素材のクレジットラインに別段の記載がない限り、記事のクリエイティブ コモンズ ライセンスに含まれています。 素材が記事のクリエイティブ コモンズ ライセンスに含まれておらず、意図した使用が法的規制で許可されていない場合、または許可されている使用を超えている場合は、著作権所有者から直接許可を得る必要があります。 このライセンスのコピーを表示するには、http://creativecommons.org/licenses/by/4.0/ にアクセスしてください。

転載と許可

Huang, B.、Liu, J.、Jiao, J. 他松の実の分類における機械学習の応用。 Sci Rep 12、8799 (2022)。 https://doi.org/10.1038/s41598-022-12754-9

引用をダウンロード

受信日: 2021 年 11 月 18 日

受理日: 2022 年 5 月 16 日

公開日: 2022 年 5 月 25 日

DOI: https://doi.org/10.1038/s41598-022-12754-9

次のリンクを共有すると、誰でもこのコンテンツを読むことができます。

申し訳ございませんが、現在この記事の共有リンクは利用できません。

Springer Nature SharedIt コンテンツ共有イニシアチブによって提供

食品分析法 (2023)

コメントを送信すると、利用規約とコミュニティ ガイドラインに従うことに同意したことになります。 虐待的なもの、または当社の規約やガイドラインに準拠していないものを見つけた場合は、不適切としてフラグを立ててください。

共有