形態測定学関係データフォーマット

TPS

形態測定学関係ツールで幅広く使われるフォーマット.どれが原典かよくわからないが,geomorphのレファレンス1では,Rohlf (2010)2が引用されている. ここでは,geomorphのレファレンスとZelditch et al. (2012)3を参考にする. 形式は以下の通り.

LM=10
2.40357	8.3304
8.48262	8.31867
8.07704	2.78968
0.962684 4.18241
5.25666	6.84918
8.68993	3.09092
4.10073	6.65153
3.04558	9.2944
5.76806	7.9663
5.16943	0.76948
IMAGE=IMG.jpg
ID=0
SCALE=0.5

通常,

  • LM=[int]: 標識点の数(必須).
    • geomorphのレファレンスによれば,2次元データの場合はLM=で3次元データの場合はLM3=とするらしい.
    • それに続き,標識点の座標値が並ぶ.各列がx,y座標それぞれに対応する.3次元の場合は3列目も存在する.
  • IMAGE=[string]はデジタイジングした画像ファイルへのパスを記述する(オプショナル).
  • ID=[string]はspecimen idを記述する.(必須).
  • SCALE=[num]は1ピクセルが何mmかを表す(オプショナル).

という形式で一つのspecimenを記述する.

これら以外にも

  • CURVES=[int]: semilandmarkで曲線を記述していることを示し,曲線の数を指定するオプション.
    • POINTS=[int]: 一つの曲線に何個の点が含まれるかを示すオプション
    • POINTS=[int]に引き続き,標識点と同様の形式で座標を記述する.
  • COMMENTS=[string]: 適当なコメントをつけるオプション.特に読み込みに影響しないみたい.

などが利用されている.

複数のspecimenを単一のファイルに記述できる.

LM=10
2.40357	8.3304
8.48262	8.31867
8.07704	2.78968
0.962684 4.18241
5.25666	6.84918
8.68993	3.09092
4.10073	6.65153
3.04558	9.2944
5.76806	7.9663
5.16943	0.76948
IMAGE=IMG_01.jpg
ID=0
SCALE=0.5

LM=10
2.04062	3.10275
5.4501	7.66928
3.48539	3.27933
8.44823	4.83298
9.52315	0.690699
8.97156	5.38617
9.66756	5.55356
1.6445	8.6957
1.81498	0.78176
8.96056	9.4228
IMAGE=IMG_02.jpg
ID=1
SCALE=0.5

...

この時,specimen間は空白行を入れても,入れなくても良い.

NTS

定義の詳細はRohlf (2012)4を参照.geomorphのレファレンスとZelditch et al. (2012)3も参考にする. 形式は以下の通り.

"Sample"
1 10 8 0 dim=2
9.16	8.419	4.301	6.754	0.878	5.254	5.853	0.738
3.484	3.892	3.628	1.225	3.375	5.514	2.341	7.108
4.623	4.642	2.913	5.442	7.559	8.357	2.97	0.508
7.267	6.193	0.045	7.723	7.455	4.917	7.901	0.376
6.968	9.12	2.804	2.542	8.848	9.587	7.216	5.864
3.375	2.747	5.586	2.3	0.406	4.378	2.453	9.107
9.254	0.767	2.604	4.208	6.354	8.82	0.533	0.184
2.757	1.483	2.444	7.956	4.936	2.837	2.886	4.254
6.956	5.745	0.742	7.33	4.08	8.547	5.122	4.472
3.057	1.304	2.149	2.805	3.315	1.127	2.502	0.962

4つの要素からなる.

  • コメント(オプショナル)
    • 行頭で"または'を用いることでコメント行であることを示す.
  • Matrix Parameter line(必須)
    • [int] [int]([char]) [int]([char]) [int] (dim=[int])
    • 1番目の数字: tpsファイルと互換性がある場合,通常1を選択する.
      1. rectangular data matrix
      2. symmetric dissimilarity matrix
      3. symmetric similarity matrix
      4. diagonal matrix
      5. tree matrix for dissimilarity data
      6. tree matrix for similarity data
      7. graph matrix for dissimilarity data
      8. graph matrix for similarity data
    • 2番目の数字: 行数.もし後ろにLがついていれば,ラベルが存在することを意味する.
    • 3番目の数字: 列数.もし後ろにLがついていれば,ラベルが存在することを意味する.
    • 4番目の数字: 欠測値の有無
      • 0: 欠測値なし
      • 1:欠測値あり.欠損値を表すコードを更に記述する(記述の仕方が具体的にはわからない.要調査).
    • dim=[int]: geomorphのレファレンスにのみ存在する,標識点の次元を表すオプション.
      • 3番目の数字では単純に列数を示している(e.g. 2次元で標識点数10なら,20).
  • Row and column labels(オプショナル): Lが指定されている場合に,ラベルを記述する.
  • Matrix data lines(必須):
    • 行列の要素を記述.
    • 欠損値は空白ではなく,parameter lineで指定した数値コードを記述する必要がある.

MTG (Mutlti-scale Tree Graph)

階層性をもった植物の構造を表現するために利用されるフォーマット. 元論文はGodin & Caraglio (1998)5

その他

随時加筆中


  1. Sherratt, E. (2017). Quick Guide to geomorph 3.0.3. ↩︎

  2. tpsRelw: Relative warp analysis. Version 1.49. Version 1.49. Department of Ecology and Evolution, State University of New York at Stony Brook, Stony Brook, NY. ↩︎

  3. Zelditch, M. L., Swiderski, D. L., & Sheets, H. D. (2012). A Practical Companion to Geometric Morphometrics for Biologists: Running analyses in freely-available software. ↩︎ ↩︎

  4. Rohlf, F. J. (2012). NTSYSpc: Numerical taxonomy and multivariate analysis system. Version 2.2. New York: Exeter Software. ↩︎

  5. Godin, C., and Caraglio, Y. A Multiscale Model of Plant Topological Structures. J Theor Biol. 1998;191:1–46. ↩︎