ECOSTRESS vegetation vswir axis 4d4366d1. v2.0 standardized NIRS package: 1 spectral source(s), 3 declared target(s). Auto-generated from dataset_card.json (verify before publication).
| Intégrité | 0.00 |
|---|---|
| Artefacts locaux | 1.00 |
| Bruit | 0.00 |
| Outliers PCA | 0.60 |
| Distance à la référence | 0.93 |
| Répétabilité | 0.00 |
| Baseline / forme | 0.82 |
| Structure multi-régimes | 0.81 |
| Diagnostic | Score | Force | Signaux | Interprétation probable |
|---|---|---|---|---|
| Splice / raccord détecteursX | 0.84 | forte | Spike rate 1.00, Jump rate 1.00, SNR non dégradé 1.00 | Rupture aux jonctions de détecteurs, calibration locale ou sonde différente. |
| Erreur calibration / référence blancheX | 0.68 | moyenne | artefacts locaux 1.00, RMS/SAM référence 0.93, Baseline/mean/area 0.82 | Décalage systématique entre campagnes, instruments ou référence blanche. |
| Erreur interpolation / rééchantillonnageX | 0.66 | moyenne | Spike rate 1.00, Jump rate 1.00, SNR normal/élevé 1.00 | Artefacts numériques ou traitement spectral incorrect. |
| Signature VERA25-likeX | 0.63 | moyenne | Spike rate 1.00, Jump rate 1.00, RMS/SAM référence 0.93 | Combinaison possible changement de sonde + splice, amplifiée par géométrie, fond ou calibration. |
| Fond différentX | 0.61 | moyenne | RMS/SAM référence 0.93, Baseline/mean/area 0.82, PCA Q 0.60 | Effet systématique du support, blanc/noir, transflectance ou environnement de mesure. |
| Différence de sonde / géométrieX | 0.56 | moyenne | RMS/SAM référence 0.93, Baseline/mean/area 0.82, PCA Q 0.60 | Modification de l'illumination, collecte, angle ou distance sonde-échantillon. |
| Dataset multi-régimesX | 0.52 | moyenne | RMS/SAM référence 0.93, Structure PCA 0.81, PCA Q 0.60 | Mélange de campagnes, opérateurs, lots, setups ou sous-populations spectrales. |
| Spectre hors domaine valideX | 0.50 | moyenne | RMS/SAM référence 0.93, Structure PCA 0.81, Mahalanobis / T2 0.49 | Variété, espèce, lot ou condition différente mais physiquement plausible. |
| Wavelengths | 2,151 |
|---|---|
| Axis range | 0.35–2.5 none |
| Mean spacing | 0.001 none |
| Grid | uniform |
| Observations | 343 |
| Value range | 0.719 – 77.3 |
|---|---|
| Mean range | 5.54 – 51.7 |
| Mean level | 25.04 |
| Area | 53.86 |
| PTP | 46.18 |
| Noise RMS | 0.0018165 |
| SNR | 1.4e+04 |
| SNR dB | 8e+01 dB |
| Dynamic range | 46.2 |
| Smoothness | 0.01931 |
| Saturated | 0.0% |
| X-outliers | 151 |
| NaN ratio | 0.00% |
|---|---|
| Inf count | 0 |
| Zero ratio | 0.00% |
| Spike count | 19,692 |
| Spike rate | 2.67% |
| Jump count | 26,937 |
| Jump rate | 3.65% |
| Clip fraction | 0.00% |
| Baseline slope | -18.914 |
|---|---|
| Curvature RMS | 0.017887 |
| D1 RMS | 0.15411 |
| RMS to mean | 4.8165 |
| RMS p95 | 10.701 |
| SAM to mean | 0.091235 |
| SAM p95 | 0.20665 |
| Affine offset p95 | 10.022 |
| Affine gain p95 Δ | 0.34173 |
| Affine residual p95 | 4.2469 |
| Xcorr lag p95 | 0 |
| PCA Q p95/median | 4.8 |
|---|---|
| Hotelling T2 p95/median | 3.9 |
| Mahalanobis H p95/median | 2 |
| Repeat groups | 18 |
| RMS intra-ID | 0 |
| SAM intra-ID | 0 |
| CV intra-ID | 0 |
| Effective rank | 2.4 |
|---|---|
| PCs → 95% var | 3 |
| PCs → 99% var | 6 |
| Top-10 cum. var | 99.8% |
| Famille | Métrique calculée | Valeur | Score | Niveau | Interprétation dataset | Causes typiques | Calcul / scoring |
|---|---|---|---|---|---|---|---|
| Intégrité des données | NaN ratiointegrity.nan_ratio | 0% | 0.00 | faible | Spectre complet | Erreur acquisition/export | count(isnan(X)) / X.sizealert = min(1, nan_ratio / 0.05) |
| Intégrité des données | Inf countintegrity.inf_count | 0 | 0.00 | faible | Normal | Calculs invalides | count(isinf(X))alert = min(1, inf_count / 1) |
| Intégrité des données | Zero ratiointegrity.zero_ratio | 0% | 0.00 | faible | Normal | Export, saturation | count(X == 0) / count(finite X)alert = min(1, zero_ratio / 0.05) |
| Amplitude globale | Mean reflectanceamplitude.mean_reflectance | 25.044 | 0.82 | fort | Valeur atypique: Trop clair / fond visible ou Trop sombre | Fond, géométrie | mean(X finite)alert reuses baseline/shape drift because absolute reflectance ranges are technology-dependent |
| Amplitude globale | Area under curveamplitude.area_under_curve | 53.863 | 0.82 | fort | Valeur atypique: Différence d'éclairement ou Normal | Distance sonde | trapezoid(mean_spectrum, spectral_axis)alert reuses baseline/shape drift because area scale depends on axis and units |
| Amplitude globale | Peak-to-peak (PTP)amplitude.peak_to_peak | 46.18 | 0.00 | faible | Variabilité forte | Saturation | max(mean_spectrum) - min(mean_spectrum)alert increases when dynamic range is abnormally flat |
| Amplitude globale | Varianceamplitude.variance | 304.95 | 0.00 | faible | Normal ou hétérogène | Mauvais contact | var(X finite)alert increases when variance/dynamic range is abnormally flat |
| Bruit | Noise RMSnoise.noise_rms | 0.0018165 | 0.00 | faible | Stable | Lampe, détecteur | median MAD(second derivative) * 1.4826 / sqrt(6)alert = noise_rms / signal_scale, saturated at 5% |
| Bruit | SNRnoise.snr | 13787 | 0.00 | faible | Bon signal | Acquisition | mean(abs(X)) / noise_rmsalert decreases with SNR dB; >=40 dB is treated as low alert |
| Bruit | Bandwise SNRnoise.bandwise_snr_min | 70.722 | 0.00 | faible | Zone fiable | Détecteur | min(abs(mean_spectrum) / local second-derivative noise)alert decreases with worst-band SNR dB; >=35 dB is treated as low alert |
| Artefacts locaux | Spike countartefacts.spike_count | 19,692 | 1.00 | fort | Artefacts | Cosmic rays, splice | count robust outliers in second derivativealert follows spike_rate, saturated at 1% |
| Artefacts locaux | Spike rateartefacts.spike_rate | 2.67% | 1.00 | fort | Spectre suspect | Interpolation | spike_count / (n_samples * (n_features - 2))alert = min(1, spike_rate / 0.01) |
| Artefacts locaux | Jump countartefacts.jump_count | 26,937 | 1.00 | fort | Raccord détecteur | Splice | count robust outliers in first derivativealert follows jump_rate, saturated at 1% |
| Artefacts locaux | Jump rateartefacts.jump_rate | 3.65% | 1.00 | fort | Problème spectral | Calibration | jump_count / (n_samples * (n_features - 1))alert = min(1, jump_rate / 0.01) |
| Artefacts locaux | Clip fractionartefacts.clip_fraction | 0.000271% | 0.00 | faible | Normal | Détecteur saturé | fraction of finite cells equal to repeated min/max extremaalert = min(1, clip_fraction / 0.01) |
| Forme spectrale | Baseline slopeshape.baseline_slope | -18.914 | 0.82 | fort | Dérive | Éclairement | linear slope of mean_spectrum over normalized axisalert = abs(slope / signal_scale), saturated at 0.5 |
| Forme spectrale | Curvature RMSshape.curvature_rms | 0.017887 | 0.04 | faible | Lisse | Fond, splice | median RMS(second derivative per spectrum)alert = curvature_rms / signal_scale, saturated at 1% |
| Forme spectrale | D1 RMSshape.d1_rms | 0.15411 | 0.07 | faible | Plat | Biologie ou artefact | median RMS(first derivative per spectrum)alert = d1_rms / signal_scale, saturated at 5% |
| Outliers multivariés | PCA Q (SPE)outliers.pca_q_ratio | 4.7827 | 0.60 | moyen | Spectre atypique | Artefact, mélange | p95(Q/SPE residual) / median(Q/SPE residual)alert = min(1, pca_q_ratio / 8) |
| Outliers multivariés | Hotelling T²outliers.hotelling_t2_ratio | 3.8787 | 0.48 | moyen | Extrême mais cohérent | Variabilité naturelle | p95(Hotelling T2) / median(Hotelling T2)alert = min(1, hotelling_t2_ratio / 8) |
| Outliers multivariés | Mahalanobis Houtliers.mahalanobis_h_ratio | 1.9694 | 0.49 | moyen | Outlier global | Domaine différent | p95(sqrt(T2)) / median(sqrt(T2))alert = min(1, mahalanobis_h_ratio / 4) |
| Comparaison à référence | RMS to mean spectrumreference.rms_to_mean_spectrum_p95 | 10.701 | 0.93 | fort | Spectre différent | Domain shift | p95 RMS distance to dataset mean spectrumalert = RMS_p95 / signal_scale, saturated at 25% |
| Comparaison à référence | Spectral Angle Mapper (SAM)reference.sam_to_mean_spectrum_p95 | 0.20665 | 0.59 | moyen | Forme différente | Fond, géométrie | p95 spectral angle to dataset mean spectrumalert = min(1, SAM_p95 / 0.35 rad) |
| Répétabilité | RMS intra-IDrepeatability.rms_intra_id | 0 | 0.00 | faible | Stable | Positionnement | median RMS distance to repeated-sample centroidalert = RMS_intra_ID / signal_scale, saturated at 10% |
| Répétabilité | SAM intra-IDrepeatability.sam_intra_id | 0 | 0.00 | faible | Stable | Acquisition | median SAM to repeated-sample centroidalert = min(1, SAM_intra_ID / 0.15 rad) |
| Répétabilité | CV intra-IDrepeatability.cv_intra_id | 0 | 0.00 | faible | Stable | Opérateur | median within-ID band CValert = min(1, CV_intra_ID / 0.25) |
| Structure du dataset | PCA score densitystructure.pca_score_density | 0.019129 | 0.81 | fort | Sous-populations | Lots différents | 1 / median kNN distance in PCA score spacealert follows density_cv/profile structure complexity, not raw density alone |
| Structure du dataset | Local Outlier Factor (LOF)structure.local_outlier_factor_p95 | 2.4319 | 0.72 | moyen | Spectre isolé | Cas rares | p95 approximate LOF from PCA-score kNN distancesalert = min(1, max(0, LOF_p95 - 1) / 2) |
| Structure du dataset | Isolation Forest scorestructure.isolation_forest_score_p95 | 0.56485 | 0.81 | fort | Spectre atypique | Diverses causes | p95 IsolationForest anomaly score on PCA scoresalert follows structure complexity; raw score is implementation-dependent |
| Famille | Métrique | Ce qu’elle détecte | Forte valeur = | Faible valeur = | Causes typiques | Calcul / score |
|---|---|---|---|---|---|---|
| Intégrité des données | NaN ratio | Données manquantes | Spectre corrompu | Spectre complet | Erreur acquisition/export | count(isnan(X)) / X.sizealert = min(1, nan_ratio / 0.05) |
| Intégrité des données | Inf count | Valeurs infinies | Corruption | Normal | Calculs invalides | count(isinf(X))alert = min(1, inf_count / 1) |
| Intégrité des données | Zero ratio | Colonnes ou cellules nulles | Spectre tronqué | Normal | Export, saturation | count(X == 0) / count(finite X)alert = min(1, zero_ratio / 0.05) |
| Amplitude globale | Mean reflectance | Niveau moyen | Trop clair / fond visible | Trop sombre | Fond, géométrie | mean(X finite)alert reuses baseline/shape drift because absolute reflectance ranges are technology-dependent |
| Amplitude globale | Area under curve | Intensité globale | Différence d'éclairement | Normal | Distance sonde | trapezoid(mean_spectrum, spectral_axis)alert reuses baseline/shape drift because area scale depends on axis and units |
| Amplitude globale | Peak-to-peak (PTP) | Dynamique | Variabilité forte | Spectre plat | Saturation | max(mean_spectrum) - min(mean_spectrum)alert increases when dynamic range is abnormally flat |
| Amplitude globale | Variance | Variabilité spectrale | Normal ou hétérogène | Spectre plat | Mauvais contact | var(X finite)alert increases when variance/dynamic range is abnormally flat |
| Bruit | Noise RMS | Bruit haute fréquence | Bruité | Stable | Lampe, détecteur | median MAD(second derivative) * 1.4826 / sqrt(6)alert = noise_rms / signal_scale, saturated at 5% |
| Bruit | SNR | Qualité signal | Bon signal | Mauvais signal | Acquisition | mean(abs(X)) / noise_rmsalert decreases with SNR dB; >=40 dB is treated as low alert |
| Bruit | Bandwise SNR | Bruit localisé | Zone fiable | Zone problématique | Détecteur | min(abs(mean_spectrum) / local second-derivative noise)alert decreases with worst-band SNR dB; >=35 dB is treated as low alert |
| Artefacts locaux | Spike count | Pics étroits | Artefacts | Spectre propre | Cosmic rays, splice | count robust outliers in second derivativealert follows spike_rate, saturated at 1% |
| Artefacts locaux | Spike rate | Densité de pics | Spectre suspect | Normal | Interpolation | spike_count / (n_samples * (n_features - 2))alert = min(1, spike_rate / 0.01) |
| Artefacts locaux | Jump count | Discontinuités | Raccord détecteur | Continu | Splice | count robust outliers in first derivativealert follows jump_rate, saturated at 1% |
| Artefacts locaux | Jump rate | Fréquence de sauts | Problème spectral | Normal | Calibration | jump_count / (n_samples * (n_features - 1))alert = min(1, jump_rate / 0.01) |
| Artefacts locaux | Clip fraction | Saturation | Clipping | Normal | Détecteur saturé | fraction of finite cells equal to repeated min/max extremaalert = min(1, clip_fraction / 0.01) |
| Forme spectrale | Baseline slope | Pente globale | Dérive | Stable | Éclairement | linear slope of mean_spectrum over normalized axisalert = abs(slope / signal_scale), saturated at 0.5 |
| Forme spectrale | Curvature RMS | Courbure | Forme inhabituelle | Lisse | Fond, splice | median RMS(second derivative per spectrum)alert = curvature_rms / signal_scale, saturated at 1% |
| Forme spectrale | D1 RMS | Variabilité locale | Spectre structuré | Plat | Biologie ou artefact | median RMS(first derivative per spectrum)alert = d1_rms / signal_scale, saturated at 5% |
| Outliers multivariés | PCA Q (SPE) | Non expliqué par PCA | Spectre atypique | Conforme | Artefact, mélange | p95(Q/SPE residual) / median(Q/SPE residual)alert = min(1, pca_q_ratio / 8) |
| Outliers multivariés | Hotelling T² | Extrême dans PCA | Extrême mais cohérent | Central | Variabilité naturelle | p95(Hotelling T2) / median(Hotelling T2)alert = min(1, hotelling_t2_ratio / 8) |
| Outliers multivariés | Mahalanobis H | Distance au nuage | Outlier global | Population normale | Domaine différent | p95(sqrt(T2)) / median(sqrt(T2))alert = min(1, mahalanobis_h_ratio / 4) |
| Comparaison à référence | RMS to mean spectrum | Distance moyenne | Spectre différent | Typique | Domain shift | p95 RMS distance to dataset mean spectrumalert = RMS_p95 / signal_scale, saturated at 25% |
| Comparaison à référence | Spectral Angle Mapper (SAM) | Différence de forme | Forme différente | Similaire | Fond, géométrie | p95 spectral angle to dataset mean spectrumalert = min(1, SAM_p95 / 0.35 rad) |
| Répétabilité | RMS intra-ID | Reproductibilité | Mauvaise répétabilité | Stable | Positionnement | median RMS distance to repeated-sample centroidalert = RMS_intra_ID / signal_scale, saturated at 10% |
| Répétabilité | SAM intra-ID | Variation de forme | Instable | Stable | Acquisition | median SAM to repeated-sample centroidalert = min(1, SAM_intra_ID / 0.15 rad) |
| Répétabilité | CV intra-ID | Variabilité interne | Mauvais contrôle | Stable | Opérateur | median within-ID band CValert = min(1, CV_intra_ID / 0.25) |
| Structure du dataset | PCA score density | Clusters | Sous-populations | Homogène | Lots différents | 1 / median kNN distance in PCA score spacealert follows density_cv/profile structure complexity, not raw density alone |
| Structure du dataset | Local Outlier Factor (LOF) | Anomalie locale | Spectre isolé | Population normale | Cas rares | p95 approximate LOF from PCA-score kNN distancesalert = min(1, max(0, LOF_p95 - 1) / 2) |
| Structure du dataset | Isolation Forest score | Anomalie globale | Spectre atypique | Normal | Diverses causes | p95 IsolationForest anomaly score on PCA scoresalert follows structure complexity; raw score is implementation-dependent |
| Technologie | Adaptations / métriques | Anomalies ciblées | Commentaire pratique |
|---|---|---|---|
| UV-Vis 300-1000 nm | Baseline, pente globale, dérive aux bords 300-350 et 900-1000; métriques par zones | Lumière parasite, mauvais blanc, saturation, faible signal aux extrémités | Les bords sont souvent instables; calculer aussi des scores edge/middle. |
| UV-Vis 300-1000 nm | Saturation / clipping proche absorbance max ou réflectance max | Signal écrêté | Très important si absorption forte. |
| UV-Vis 300-1000 nm | Red-edge, position de maximum, ratios de bandes si végétal | Décalage biologique ou artefact optique | Aide à distinguer changement réel et problème d'acquisition. |
| UV-Vis 300-1000 nm | Smoothness / roughness index | Bruit haute fréquence | Souvent plus informatif que le SNR seul. |
| MIR / ATR-FTIR | ATR contact quality index: intensité globale, aire totale, profondeur des bandes clés | Mauvais contact cristal-échantillon | Crucial: beaucoup d'anomalies viennent du contact ATR. |
| MIR / ATR-FTIR | CO2 / H2O atmospheric bands | Mauvaise correction atmosphérique | Pics parasites fréquents. |
| MIR / ATR-FTIR | Baseline curvature / rubber-band residual | Diffusion, contact, dérive baseline | Très utile avant PCA. |
| MIR / ATR-FTIR | Peak position shift | Mauvais alignement spectral / calibration | Important en FTIR car de petits shifts comptent. |
| MIR / ATR-FTIR | Band area ratios sur bandes connues | Spectre chimiquement incohérent | À adapter par matrice: polysaccharides, protéines, lipides, etc. |
| HS-MS | Total Ion Current (TIC), Base Peak Intensity (BPI) | Injection faible, ionisation instable | Équivalent MS du niveau global spectral. |
| HS-MS | Nombre de pics détectés | Spectre pauvre ou trop bruité | Trop peu = mauvais signal; trop = bruit/contamination. |
| HS-MS | Mass accuracy / m/z drift | Problème calibration masse | Fondamental en HRMS. |
| HS-MS | Retention time drift si LC/GC-MS | Dérive chromatographique | À suivre sur standards/QC pools. |
| HS-MS | Blank contamination score | Contaminants / carry-over | Comparer échantillons vs blancs. |
| HS-MS | Internal standard CV | Variabilité instrumentale | Très robuste si standards disponibles. |
| HS-MS | Missingness par feature | Instabilité de détection | Crucial pour filtrer les variables. |
| Avec répétitions | RMS intra-échantillon | Répétabilité globale | Applicable à toutes les technologies. |
| Avec répétitions | SAM / corrélation intra-échantillon | Répétabilité de forme | Très utile pour spectres. |
| Avec répétitions | CV intra-échantillon par bande / feature | Répétabilité locale | Détecte les zones instables. |
| Avec répétitions | ICC ou variance components | Part variance échantillon vs technique | Très utile si plusieurs répétitions par sample. |
| Avec répétitions | Distance au centroïde intra-ID | Répétition aberrante | Permet de flagger la mauvaise répétition plutôt que le sample entier. |
| Famille de bug potentiel | Méthodes à ajouter | Ce que ça détecte | État dans l’explorateur |
|---|---|---|---|
| Shift spectral global | Corrélation spectre moyen inter-dataset, DTW, cross-correlation, comparaison positions de pics | Décalage en longueur d'onde, mauvais alignement, interpolation différente | Partiellement calculé: cross-correlation lag et dispersion des positions de pics vs spectre moyen. |
| Baseline / offset / gain | Régression chaque spectre vs spectre moyen: x = a + b ref + residual; suivi de a, b, RMS résiduel | Offset additif, effet multiplicatif, dérive de baseline | Calculé dans reference.affine_*. |
| Mélange de lignes / mauvais appariement X-M-Y | Vérification index, hash des lignes, duplication ID, distance spectrale intra-ID, labels incohérents | Lignes mélangées, metadata mal alignées, Y attribué au mauvais spectre | Partiellement couvert par répétabilité intra-ID; checks index/hash à ajouter au pipeline canonical. |
| Fuite d'information / répétitions mal splitées | GroupKFold par sample_id vs StratifiedKFold random; audit des partitions par sample_id | Performance artificiellement bonne due aux répétitions | Nécessite splits et benchmark modèle; non calculé par la carte descriptive. |
| Label bugs | Échantillons proches en X mais Y différents, confident learning, erreurs systématiques FP/FN | Y inversés, erreurs de saisie, classes ambiguës | Nécessite Y et/ou modèle; recommandé pour l'explorateur supervisé. |
| Sous-domaines cachés | PCA/UMAP/t-SNE + clustering non supervisé + association avec dataset/Y/date/operator | Lots, campagnes, sondes, backgrounds non renseignés | Partiellement calculé par structure PCA/LOF; UMAP/t-SNE hors carte statique. |
| Artefacts localisés inconnus | Carte wavelength x dataset: différence moyenne, différence variance, KS par longueur d'onde | Régions spectrales anormales non anticipées | À calculer au niveau banque quand plusieurs datasets partagent un axe spectral. |
| Ruptures instrumentales | Discontinuités dans dérivées, changepoint detection | Splice, raccord détecteur, saut local non prévu | Calculé par jump/spike rates; changepoint plus avancé à ajouter. |
| Mélange / contamination spectrale | NMF / unmixing / reconstruction par convex hull | Composante externe: fond, plastique, sol | Non calculé automatiquement; nécessite hypothèses de composants ou grande bibliothèque. |
| Features instables mais prédictives | Importance modèle vs instabilité QC par variable | Modèle qui apprend un artefact plutôt qu'un signal biologique | Nécessite modèle supervisé; recommandé pour rapports de benchmark. |
| n / missing | 325 / 0 |
|---|---|
| Classes | 53 |
| Balance (entropy) | 0.98 |
| Imbalance ratio | 6 |
| Top class | Arctostaphylos glandulosa 3 (13) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 2 |
| Balance (entropy) | 0.53 |
| Imbalance ratio | 7 |
| Top class | vegetation (286) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 2 |
| Balance (entropy) | 0.99 |
| Imbalance ratio | 1 |
| Top class | Shrub (178) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 325 |
| Balance (entropy) | 1 |
| Imbalance ratio | 1 |
| Top class | vegetation.shrub.adenostoma.fasciculatum.vswir.vh033.ucsb.asd.spectrum (1) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 2 |
| Balance (entropy) | 0.53 |
| Imbalance ratio | 7 |
| Top class | vegetation (286) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 41 |
| Balance (entropy) | 0.95 |
| Imbalance ratio | 2e+01 |
| Top class | USA, Massachusetts, Harvard Forest (39) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 9 |
| Balance (entropy) | 0.98 |
| Imbalance ratio | 2 |
| Top class | 4/1/2013 (48) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 2 |
| Balance (entropy) | 0.99 |
| Imbalance ratio | 1 |
| Top class | Shrub (178) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 2 |
| Balance (entropy) | 0.53 |
| Imbalance ratio | 7 |
| Top class | Samples were collected as part of the HyspIRI Airborne Campaign. 48 individual plants were sampled in three times in 2013 - spring summer and fall. The name of the sample includes a 1 2 or 3 which references a different individual of the species. Samples were taken to JPL and processed within 48 hours of collection. The same leaves were processed in the Nicolet and then measured using the ASD. (286) |
| n / missing | 325 / 0 |
|---|---|
| Classes | 325 |
| Balance (entropy) | 1 |
| Imbalance ratio | 1 |
| Top class | vegetation.shrub.adenostoma.fasciculatum.vswir.vh033.ucsb.asd.ancillary.txt (1) |
7 variable(s) omitted (no recorded values).
| Alignment level | observation |
|---|---|
| Sample id available | yes |
| Samples | 325 |
| Observations (total) | 343 |
| Reps per sample | min 1 · mean 1.055 · max 2 |
| Contributor | ECOSTRESS Spectral Library |
|---|---|
| Origin · url [open] | https://speclib.jpl.nasa.gov/download |
| Origin · url [open] | https://speclib.jpl.nasa.gov/ |
| Origin · script [manual] | source_to_standard.py — standardization script (maintainer-only) |
| Publication | 10.1016/j.rse.2019.05.015 — The ECOSTRESS spectral library version 1.0 |
| Publication | 10.1016/j.rse.2008.11.007 — The ASTER Spectral Library Version 2.0 |
| Tier | private |
|---|---|
| License | LicenseRef-not-cleared |
| Permitted use | Research and benchmarking; private use only. |
| Access policy | Manual download / private-use-only per source. |
| Redistribution | Official ECOSTRESS page requests citation and states copyright/all rights reserved; converted matrices are private/internal until redistribution rights are clarified. |
| Content version | 1.0.0 |
| Schema / protocol | 2.0 |
| Content hash | 84e499b3be715fad… |
| Processing hash | 1f5b8f225e911af7… |
| Metadata hash | aa5453cc61f5c282… |
# pip install nirs4all-datasets from nirs4all_datasets import get # private dataset — export requires a Dataverse token ds = get("ecostress_vegetation_vswir_2151points_343rows", token="…") X, y = ds.x(), ds.y() print(X.shape, y.shape)
Metadata downloads are available for public datasets only. The dataset bytes are never served here — fetch them from the origin / DOI above.