Dump

by @endotaishi_

【論文】A canopy photosynthesis model based on a highly generalizable artificial neural network incorporated with a mechanistic understanding of single-leaf photosynthesis

Aug 29, 2024

#1. Introduction

群落の光合成速度を実際に測定するのは難しいので2つの種類に分類される数理モデル：プロセスベースモデルと経験モデルが主に使用されます。

プロセスベースモデルは作物群落と周囲の環境の物理生態学的相互作用の理解に基づいて組み立てられ、群落光合成速度（Ac)の理論的解釈を与えます。しかし、プロセスベースモデルは物理生態学的モデルパラメータをたくさん必要とし、それらは厳密な実験を行わなければ得ることができないものです。また、最近の研究によると観測値とプロセスベースモデルによる推測値にかなりの差があることがわかっています。

経験モデルはモデルパラメータを必要とせず、単純なインプットとアウトプットの関係から成り立ちます。与えられたインプットとアウトプットのデータから内部的なパラメータがキャリブレート（検証、テスト）されます。人工ニューラルネットワーク（ANN)は経験モデルの一つです。しかし、経験モデルはインプットとアウトプットのデータの関係の外側の予測に弱いです（外挿性の問題、limited generalizability）。さらに、小規模な農場では渦相関法を利用したCO2フラックスの観測が難しいため、ANNモデルの適用に困難が生じます。

こうしたANNの弱点を克服するために、Acの基本的な構成要素である単葉光合成速度（AL)はプロセスベースに計算しています。また、LAIは群落の画像から群落内の光の減衰理論に基づいて推定されます。ALとLAIからANNを用いてAcを推定しています。研究内でハイブリッドANNモデルは単純なANNモデルと比較されています。一般気象要素よりもALがAcと密に関わるため、ハイブリッドANNモデルの方が高い一般化能力を持つことが期待されています。

2. Hybrid ANN model

2.1 Outline of the developed ANN models

Acを推定するために単純なANNモデルとハイブリッドANNモデルの2つを開発しました。

単純なANNモデルは、気象データ4つとLAIの合計5つの入力値を持ちます。一方でハイブリッドANNモデルはALとLAIの2つの入力値を持ちますが、ALは単純なANNモデルに入力される4つの気象データからプロセスベースモデルを用いて推定しておいたものです。どちらのモデルでもLAIは群落の写真から推定されます。

一般的なANNモデルは1つの入力層、複数の隠れ層（中間層）、1つの出力層を持ちます。今回の2つのモデルの違う点は入力層のみです。隠れ層の構造は試行を重ねて決定します：隠れ層の数（1〜3）と各層のノードの数（1〜50）の合計150パターンを試行しました。ANNのパフォーマンスはこの隠れ層の構造で少し影響を受けます。

ある層のすべてのノードは次の層の各ノードと接続しています。隠れ層に入力される値は、入力層（または1つ目の隠れ層）の各ノードの値にそれぞれ重みをかけた値を合計し、それにActivate functionを適用して計算されます。この研究ではReLU関数と呼ばれるActivate functionを使っています。ReLU関数は、関数に入力された値が0以上だったらそのまま、0より小さかったら0を返します。2つ目の隠れ層から送信された値の合計が出力層の値になります。重みはトレーニングを繰り返して、Acの観測値と推定値の誤差が最も小さくなるように決定されます。

トレーニングアルゴリズムとしては、KingmaとBa（2015）のデフォルトパラメータを使用したAdamオプティマイザを使用しました。エポック数は100に設定され、ミニバッチサイズは32としました。エポック数をさらに増やしても、ANNモデルの性能は向上しませんでした。

GPT：「エポック数」とは、モデルがトレーニングデータセット全体を何回繰り返して学習するかを指します。ミニバッチサイズとは、トレーニングデータセットを小さなバッチに分割して、そのバッチごとにモデルを更新する際のデータの数を指します。

2.2 Input information

2.2.1 Environmental information and crop images

入力される気象要素PPFD, Ta, VPD, Caは、光合成をドライブする主要因であり、CO2フラックスの推定にも用いられます。

LAIは光合成を行う細胞の量を代表する値であり、長期的にAcにかなり影響します。

2.2.2 Information processing for highly explainable information

原理的にはALをLAIに対して積分することでAcが求まるため、ALとLAIはAcと強く関係しており、これらをANNモデルに入力することでパフォーマンスの向上が見込めます。

AL （Memo）Farquhar et al. (1980)を引用しながら、光合成、蒸発散、コンダクタンスとか諸々の計算をしています。いつか参考にします。
LAI 群落を上から撮った写真を白黒二値化して、群落内を通る光の減衰率の公式からLAIを推定しています。R2の値も1にかなりちかく、精度もかなり良さそうです。

2.3 Performance criteria

（Memo）R2はマイナスを取る公式が使われていた。

3. Data preparation

3.1 Outline

オープンチャンバー法とタイムラプスを使った撮影を組み合わせてANNモデルのトレーニング、ヴァリデーション、テストのためのAc、気象データ、LAIを用意しています。

測定は5月、8月、1月の3つの時期に、それぞれ異なるCO2濃度下で行われました。合計9つのデータセットが得られました。

3.2 Plant materials

（ほうれん草の育て方）

3.3 Measurement

3.3.1 Measurement system

オープンチャンバー法の説明。

LAI測定のためのタイムラプス撮影ではラズパイが使用されています。

（memo）NFTシステム。

3.3.2 Measurement conditions

9つのデータセットの詳細について説明されています。時期や測定時間、CO2濃度について。

4. Results and discussion

4.1 Performance of the hybrid ANN model in comparison with that of the simple ANN model

4.2 Performance with a smaller amount of training data

5. Conclusions

back