← Back to the catalog
Private

ECOSTRESS mineral vswir axis 61f98690

ecostress · other

ECOSTRESS mineral vswir axis 61f98690. v2.0 standardized NIRS package: 1 spectral source(s), 4 declared target(s). Auto-generated from dataset_card.json (verify before publication).

nirv2ecostress
🔒
Private dataset. Full metadata and metrics are shown, but the bytes are not redistributed here — exporting the data requires a Dataverse token. The identity card carries no spectra, only descriptive statistics.
148
samples
2,101
wavelengths
1
sources
4
targets
27
metadata
other
family

Dataset property explorer

Mean profile risk0.58
Highest axisDistance à la référence · 1.00
Diagnostics8
Sources profiled1
ECOSTRESS mineral vswir axis 61f98690 property profile0.250.50.751integritynoiseartefactsbaselinePCA outliersreferencerepeatabilitystructureECOSTRESS mineral vswir axis 61f98690 profileintegrity: 0.00noise: 0.01artefacts: 0.81baseline: 0.33PCA outliers: 0.78reference: 1.00repeatability: 0.91structure: 0.81ECOSTRESS miner…0 center · 1 outer ring · outward = stronger anomaly / heterogeneity signal

Profile axes

Intégrité0.00
Artefacts locaux0.81
Bruit0.01
Outliers PCA0.78
Distance à la référence1.00
Répétabilité0.91
Baseline / forme0.33
Structure multi-régimes0.81
Diagnostic hypotheses00.250.50.751hypothesis scoreMauvaise répétabilité d'acqui…Mauvaise répétabilité d'acquisition: 0.740.74Splice / raccord détecteursSplice / raccord détecteurs: 0.710.71Dataset multi-régimesDataset multi-régimes: 0.670.67Signature VERA25-likeSignature VERA25-like: 0.650.65Différence de sonde / géométr…Différence de sonde / géométrie: 0.630.63Mélange feuille + fondMélange feuille + fond: 0.540.54Erreur interpolation / réécha…Erreur interpolation / rééchantillonnage: 0.540.54Spectre hors domaine valideSpectre hors domaine valide: 0.540.54
DiagnosticScoreForceSignauxInterprétation probable
Mauvaise répétabilité d'acquisitionX0.74forteRMS/SAM intra-ID 0.91, Bruit/artefacts variables 0.81Positionnement, opérateur ou protocole instable; investiguer les répétitions intra-ID.
Splice / raccord détecteursX0.71moyenneRMS/SAM référence 1.00, SNR non dégradé 1.00, Jump rate 0.81Rupture aux jonctions de détecteurs, calibration locale ou sonde différente.
Dataset multi-régimesX0.67moyenneRMS/SAM référence 1.00, Répétabilité 0.91, Structure PCA 0.81Mélange de campagnes, opérateurs, lots, setups ou sous-populations spectrales.
Signature VERA25-likeX0.65moyenneRMS/SAM référence 1.00, Jump rate 0.81, PCA Q 0.78Combinaison possible changement de sonde + splice, amplifiée par géométrie, fond ou calibration.
Différence de sonde / géométrieX0.63moyenneRMS/SAM référence 1.00, Répétabilité 0.91, PCA Q 0.78Modification de l'illumination, collecte, angle ou distance sonde-échantillon.
Mélange feuille + fondX0.54moyenneRMS/SAM référence 1.00, Répétabilité 0.91, PCA Q 0.78Couverture partielle du spot; contribution du fond ou du support.
Erreur interpolation / rééchantillonnageX0.54moyenneSNR normal/élevé 1.00, Noise RMS faible 0.99, Jump rate 0.81Artefacts numériques ou traitement spectral incorrect.
Spectre hors domaine valideX0.54moyenneRMS/SAM référence 1.00, Structure PCA 0.81, Mahalanobis / T2 0.46Variété, espèce, lot ou condition différente mais physiquement plausible.

Spectral sources

mineral vswir

X · other · source instruments vary by sample
mineral vswir spectra02550751000123q05-q95 envelopeq25-q75 envelopemedian spectrummedianq25–q75q05–q95wavelength / none2.5none — median 43.29 (q25–q75 20.61–64.76)2.485none — median 43.74 (q25–q75 20.43–65.59)2.47none — median 44.59 (q25–q75 21.49–66.14)2.455none — median 45 (q25–q75 21.86–66.85)2.44none — median 46.28 (q25–q75 22.22–67.77)2.424none — median 47.09 (q25–q75 23.02–68.13)2.409none — median 47.87 (q25–q75 23.78–69.07)2.394none — median 46.89 (q25–q75 23.71–69.34)2.379none — median 47.87 (q25–q75 23.76–69.6)2.364none — median 48.86 (q25–q75 24.77–70.27)2.349none — median 48.88 (q25–q75 25.43–70.28)2.334none — median 49.42 (q25–q75 25.28–70.04)2.319none — median 49.35 (q25–q75 26.41–70.01)2.304none — median 50.03 (q25–q75 26.42–70.99)2.288none — median 51.73 (q25–q75 27.75–71.45)2.273none — median 52.16 (q25–q75 28.74–71.87)2.258none — median 52.83 (q25–q75 29.22–73.13)2.243none — median 53.54 (q25–q75 28.87–73.32)2.228none — median 54.43 (q25–q75 30.63–73.51)2.213none — median 54.77 (q25–q75 31.23–73.78)2.198none — median 55.47 (q25–q75 30.82–74.69)2.183none — median 55.8 (q25–q75 32.28–74.92)2.168none — median 57.24 (q25–q75 32.36–75.98)2.153none — median 59.02 (q25–q75 33.11–76.75)2.137none — median 60.01 (q25–q75 33.87–76.86)2.122none — median 59.99 (q25–q75 33.44–76.58)2.107none — median 59.78 (q25–q75 33.66–76.25)2.092none — median 60.68 (q25–q75 33.48–76.26)2.077none — median 60.45 (q25–q75 33.52–76.73)2.062none — median 60.59 (q25–q75 33.91–77.17)2.047none — median 60.15 (q25–q75 33.86–77.38)2.032none — median 59.48 (q25–q75 32.98–77.51)2.017none — median 58.79 (q25–q75 32.38–76.9)2.001none — median 56.81 (q25–q75 32.03–76.41)1.986none — median 56.78 (q25–q75 30.8–76.41)1.971none — median 56.73 (q25–q75 30.31–76.42)1.956none — median 57.04 (q25–q75 29.92–76.02)1.941none — median 57.27 (q25–q75 28.94–75.64)1.926none — median 57.29 (q25–q75 29.11–76.18)1.911none — median 57.29 (q25–q75 29.17–76.82)1.896none — median 59.12 (q25–q75 31.77–77.76)1.881none — median 61.04 (q25–q75 36.99–78.77)1.865none — median 64.41 (q25–q75 40.36–79.69)1.85none — median 64.73 (q25–q75 41.36–79.77)1.835none — median 65.7 (q25–q75 40.21–79.98)1.82none — median 65.99 (q25–q75 40.67–80.22)1.805none — median 66.01 (q25–q75 40.26–80.37)1.79none — median 66.47 (q25–q75 39.67–80.41)1.775none — median 66.5 (q25–q75 39.63–80.36)1.76none — median 66.48 (q25–q75 40.17–80.47)1.745none — median 66.64 (q25–q75 40.6–80.52)1.729none — median 66.99 (q25–q75 40.35–80.72)1.714none — median 67.64 (q25–q75 39.73–80.9)1.699none — median 68.1 (q25–q75 40.4–81.09)1.684none — median 68.37 (q25–q75 40–81.14)1.669none — median 68.15 (q25–q75 39.43–81.32)1.654none — median 67.83 (q25–q75 38.98–81.42)1.639none — median 67.5 (q25–q75 39.44–81.32)1.624none — median 67.35 (q25–q75 39.79–81.31)1.609none — median 67.25 (q25–q75 39.84–81.15)1.594none — median 67.14 (q25–q75 39.52–81.04)1.578none — median 67 (q25–q75 38.83–80.91)1.563none — median 66.57 (q25–q75 38.39–80.92)1.548none — median 66.09 (q25–q75 37.87–80.6)1.533none — median 65.77 (q25–q75 37.46–80.57)1.518none — median 65.03 (q25–q75 36.94–80.42)1.503none — median 63.97 (q25–q75 36.41–80.11)1.488none — median 62.96 (q25–q75 35.71–79.76)1.473none — median 61.87 (q25–q75 34.05–79.42)1.458none — median 62.37 (q25–q75 34.96–79.57)1.442none — median 61.26 (q25–q75 33.78–79.11)1.427none — median 60.96 (q25–q75 33.51–78.84)1.412none — median 60.93 (q25–q75 35.21–78.65)1.397none — median 63.55 (q25–q75 34.3–79.47)1.382none — median 67.99 (q25–q75 37.17–80.62)1.367none — median 69.69 (q25–q75 38.22–81.54)1.352none — median 69.74 (q25–q75 37.2–81.47)1.337none — median 69.86 (q25–q75 37.31–81.63)1.322none — median 70.11 (q25–q75 36.12–82.32)1.306none — median 70.19 (q25–q75 35.57–82.37)1.291none — median 70.18 (q25–q75 34.82–82.37)1.276none — median 69.94 (q25–q75 34.05–82.41)1.261none — median 69.93 (q25–q75 33.18–82.57)1.246none — median 70.07 (q25–q75 32.76–82.52)1.231none — median 69.94 (q25–q75 32.2–82.6)1.216none — median 69.83 (q25–q75 32.01–82.63)1.201none — median 69.43 (q25–q75 31.74–82.65)1.186none — median 69.56 (q25–q75 31.31–82.61)1.171none — median 69.2 (q25–q75 30.09–82.21)1.155none — median 69.29 (q25–q75 28.97–82.89)1.14none — median 69.28 (q25–q75 29.41–83.4)1.125none — median 68.73 (q25–q75 28.5–83.64)1.11none — median 68.83 (q25–q75 27.88–83.77)1.095none — median 68.84 (q25–q75 27.53–83.73)1.08none — median 68.33 (q25–q75 26.05–83.83)1.065none — median 68.28 (q25–q75 25.89–83.79)1.05none — median 67.86 (q25–q75 25.89–83.75)1.035none — median 68.27 (q25–q75 25.92–83.63)1.019none — median 68.18 (q25–q75 25.69–83.57)1.004none — median 67.75 (q25–q75 26.01–83.48)0.989none — median 68.06 (q25–q75 26.17–83.08)0.974none — median 68.41 (q25–q75 25.88–82.99)0.959none — median 67.94 (q25–q75 25.51–83.19)0.944none — median 68.04 (q25–q75 24.98–83.39)0.929none — median 67.97 (q25–q75 24.8–83.61)0.914none — median 68.15 (q25–q75 24.42–83.86)0.899none — median 68.22 (q25–q75 23.66–83.82)0.883none — median 68.26 (q25–q75 23.81–83.8)0.868none — median 67.97 (q25–q75 24.21–83.78)0.853none — median 67.99 (q25–q75 25.36–83.79)0.838none — median 67.79 (q25–q75 25.25–83.95)0.823none — median 68.19 (q25–q75 26.18–83.93)0.808none — median 67.63 (q25–q75 25.82–83.98)0.793none — median 67.1 (q25–q75 26.21–83.88)0.778none — median 66.92 (q25–q75 27.61–83.79)0.763none — median 66.94 (q25–q75 27.92–83.59)0.747none — median 66.2 (q25–q75 27.92–83.47)0.732none — median 65.7 (q25–q75 28.12–83.39)0.717none — median 65.3 (q25–q75 28.51–83.41)0.702none — median 65.09 (q25–q75 26.51–83.35)0.687none — median 64.76 (q25–q75 24.54–83.16)0.672none — median 63.95 (q25–q75 23.75–83.21)0.657none — median 63.18 (q25–q75 25.01–82.91)0.642none — median 63.17 (q25–q75 24.23–82.43)0.627none — median 61.92 (q25–q75 24.14–82.12)0.612none — median 61.58 (q25–q75 24.55–81.78)0.596none — median 61.09 (q25–q75 24.61–81.55)0.581none — median 59.85 (q25–q75 24.67–81.37)0.566none — median 59.81 (q25–q75 24.43–81.06)0.551none — median 59.47 (q25–q75 24.24–80.5)0.536none — median 59.02 (q25–q75 22.51–79.99)0.521none — median 58.81 (q25–q75 21.01–79.3)0.506none — median 57.77 (q25–q75 19.34–78.87)0.491none — median 56.75 (q25–q75 17.4–77.24)0.476none — median 55.46 (q25–q75 16.19–76.27)0.46none — median 52.66 (q25–q75 15.22–75.54)0.445none — median 50.83 (q25–q75 14.02–74.7)0.43none — median 48.75 (q25–q75 12.85–73.68)0.415none — median 47.26 (q25–q75 11.12–72.47)0.4none — median 44.3 (q25–q75 10.58–70.96)

Sampling

Wavelengths2,101
Axis range0.4–2.5 none
Mean spacing0.001 none
Griduniform
Observations406

Signal & quality

Value range1.13 – 96.5
Mean range42.3 – 58.8
Mean level54.32
Area114.1
PTP16.47
Noise RMS0.025994
SNR2.1e+03
SNR dB7e+01 dB
Dynamic range16.5
Smoothness0.109
Saturated0.0%
X-outliers251

Integrity & artefacts

NaN ratio0.00%
Inf count0
Zero ratio0.00%
Spike count2,206
Spike rate0.26%
Jump count6,900
Jump rate0.81%
Clip fraction0.00%

Shape & reference

Baseline slope-3.7439
Curvature RMS0.098931
D1 RMS0.095932
RMS to mean25.206
RMS p9547.356
SAM to mean0.15822
SAM p950.53548
Affine offset p95106.45
Affine gain p95 Δ2.2219
Affine residual p9522.569
Xcorr lag p9550

Outliers & repeatability

PCA Q p95/median6.3
Hotelling T2 p95/median3.4
Mahalanobis H p95/median1.8
Repeat groups129
RMS intra-ID4.9456
SAM intra-ID0.048785
CV intra-ID0.13597

Dimensionality (PCA)

Effective rank1.9
PCs → 95% var2
PCs → 99% var7
Top-10 cum. var99.6%
Computed metric scores 29worst 1.00
FamilleMétrique calculéeValeurScoreNiveauInterprétation datasetCauses typiquesCalcul / scoring
Intégrité des donnéesNaN ratiointegrity.nan_ratio0%0.00faibleSpectre completErreur acquisition/exportcount(isnan(X)) / X.sizealert = min(1, nan_ratio / 0.05)
Intégrité des donnéesInf countintegrity.inf_count00.00faibleNormalCalculs invalidescount(isinf(X))alert = min(1, inf_count / 1)
Intégrité des donnéesZero ratiointegrity.zero_ratio0%0.00faibleNormalExport, saturationcount(X == 0) / count(finite X)alert = min(1, zero_ratio / 0.05)
Amplitude globaleMean reflectanceamplitude.mean_reflectance54.3150.33faibleTrop sombreFond, géométriemean(X finite)alert reuses baseline/shape drift because absolute reflectance ranges are technology-dependent
Amplitude globaleArea under curveamplitude.area_under_curve114.070.33faibleNormalDistance sondetrapezoid(mean_spectrum, spectral_axis)alert reuses baseline/shape drift because area scale depends on axis and units
Amplitude globalePeak-to-peak (PTP)amplitude.peak_to_peak16.4680.00faibleVariabilité forteSaturationmax(mean_spectrum) - min(mean_spectrum)alert increases when dynamic range is abnormally flat
Amplitude globaleVarianceamplitude.variance814.460.00faibleNormal ou hétérogèneMauvais contactvar(X finite)alert increases when variance/dynamic range is abnormally flat
BruitNoise RMSnoise.noise_rms0.0259940.01faibleStableLampe, détecteurmedian MAD(second derivative) * 1.4826 / sqrt(6)alert = noise_rms / signal_scale, saturated at 5%
BruitSNRnoise.snr2089.50.00faibleBon signalAcquisitionmean(abs(X)) / noise_rmsalert decreases with SNR dB; >=40 dB is treated as low alert
BruitBandwise SNRnoise.bandwise_snr_min263.350.00faibleZone fiableDétecteurmin(abs(mean_spectrum) / local second-derivative noise)alert decreases with worst-band SNR dB; >=35 dB is treated as low alert
Artefacts locauxSpike countartefacts.spike_count2,2060.26faibleSpectre propreCosmic rays, splicecount robust outliers in second derivativealert follows spike_rate, saturated at 1%
Artefacts locauxSpike rateartefacts.spike_rate0.259%0.26faibleNormalInterpolationspike_count / (n_samples * (n_features - 2))alert = min(1, spike_rate / 0.01)
Artefacts locauxJump countartefacts.jump_count6,9000.81fortRaccord détecteurSplicecount robust outliers in first derivativealert follows jump_rate, saturated at 1%
Artefacts locauxJump rateartefacts.jump_rate0.809%0.81fortProblème spectralCalibrationjump_count / (n_samples * (n_features - 1))alert = min(1, jump_rate / 0.01)
Artefacts locauxClip fractionartefacts.clip_fraction0.000234%0.00faibleNormalDétecteur saturéfraction of finite cells equal to repeated min/max extremaalert = min(1, clip_fraction / 0.01)
Forme spectraleBaseline slopeshape.baseline_slope-3.74390.14faibleStableÉclairementlinear slope of mean_spectrum over normalized axisalert = abs(slope / signal_scale), saturated at 0.5
Forme spectraleCurvature RMSshape.curvature_rms0.0989310.18faibleLisseFond, splicemedian RMS(second derivative per spectrum)alert = curvature_rms / signal_scale, saturated at 1%
Forme spectraleD1 RMSshape.d1_rms0.0959320.04faiblePlatBiologie ou artefactmedian RMS(first derivative per spectrum)alert = d1_rms / signal_scale, saturated at 5%
Outliers multivariésPCA Q (SPE)outliers.pca_q_ratio6.25820.78fortSpectre atypiqueArtefact, mélangep95(Q/SPE residual) / median(Q/SPE residual)alert = min(1, pca_q_ratio / 8)
Outliers multivariésHotelling T²outliers.hotelling_t2_ratio3.38780.42moyenExtrême mais cohérentVariabilité naturellep95(Hotelling T2) / median(Hotelling T2)alert = min(1, hotelling_t2_ratio / 8)
Outliers multivariésMahalanobis Houtliers.mahalanobis_h_ratio1.84030.46moyenOutlier globalDomaine différentp95(sqrt(T2)) / median(sqrt(T2))alert = min(1, mahalanobis_h_ratio / 4)
Comparaison à référenceRMS to mean spectrumreference.rms_to_mean_spectrum_p9547.3561.00fortSpectre différentDomain shiftp95 RMS distance to dataset mean spectrumalert = RMS_p95 / signal_scale, saturated at 25%
Comparaison à référenceSpectral Angle Mapper (SAM)reference.sam_to_mean_spectrum_p950.535481.00fortForme différenteFond, géométriep95 spectral angle to dataset mean spectrumalert = min(1, SAM_p95 / 0.35 rad)
RépétabilitéRMS intra-IDrepeatability.rms_intra_id4.94560.91fortMauvaise répétabilitéPositionnementmedian RMS distance to repeated-sample centroidalert = RMS_intra_ID / signal_scale, saturated at 10%
RépétabilitéSAM intra-IDrepeatability.sam_intra_id0.0487850.33faibleStableAcquisitionmedian SAM to repeated-sample centroidalert = min(1, SAM_intra_ID / 0.15 rad)
RépétabilitéCV intra-IDrepeatability.cv_intra_id0.135970.54moyenMauvais contrôleOpérateurmedian within-ID band CValert = min(1, CV_intra_ID / 0.25)
Structure du datasetPCA score densitystructure.pca_score_density0.00889450.81fortSous-populationsLots différents1 / median kNN distance in PCA score spacealert follows density_cv/profile structure complexity, not raw density alone
Structure du datasetLocal Outlier Factor (LOF)structure.local_outlier_factor_p952.42910.71moyenSpectre isoléCas raresp95 approximate LOF from PCA-score kNN distancesalert = min(1, max(0, LOF_p95 - 1) / 2)
Structure du datasetIsolation Forest scorestructure.isolation_forest_score_p950.557710.81fortSpectre atypiqueDiverses causesp95 IsolationForest anomaly score on PCA scoresalert follows structure complexity; raw score is implementation-dependent
X PCA score plot-2,00002,0004,000-2,000-1,00001,0002,000PC1 -894.6 · PC2 -188.4PC1 1311 · PC2 559PC1 -1569 · PC2 -277.3PC1 -299.2 · PC2 217.6PC1 -1221 · PC2 -240.5PC1 785.9 · PC2 528.8PC1 219.9 · PC2 1410PC1 -296.7 · PC2 980.6PC1 414.5 · PC2 1570PC1 -239.5 · PC2 1264PC1 -505.7 · PC2 982.1PC1 -191.8 · PC2 1215PC1 -955.1 · PC2 702.9PC1 -800.5 · PC2 613.1PC1 -740.2 · PC2 831.3PC1 -638 · PC2 905.5PC1 -1285 · PC2 296.7PC1 -434.9 · PC2 914.8PC1 -320.4 · PC2 1199PC1 -698 · PC2 797.3PC1 -69.71 · PC2 1415PC1 -499 · PC2 1074PC1 -687.1 · PC2 670.7PC1 -339.9 · PC2 1038PC1 -1041 · PC2 38.93PC1 -374.4 · PC2 210.4PC1 1868 · PC2 -36.17PC1 -1029 · PC2 -17.14PC1 -1299 · PC2 -62.28PC1 -1204 · PC2 55.15PC1 -1304 · PC2 -220.1PC1 -1174 · PC2 39.29PC1 421.1 · PC2 1279PC1 197.5 · PC2 -307.2PC1 -1122 · PC2 173.7PC1 -1054 · PC2 469.7PC1 1725 · PC2 -56.25PC1 -486.7 · PC2 -37.13PC1 971.2 · PC2 -624.2PC1 -1669 · PC2 -176.4PC1 -1425 · PC2 -92.96PC1 502.5 · PC2 -535.5PC1 -1434 · PC2 -200.3PC1 -1497 · PC2 -164.3PC1 -1479 · PC2 -146.1PC1 -1373 · PC2 -234.5PC1 -1578 · PC2 -129.6PC1 -471.8 · PC2 919.7PC1 -1526 · PC2 -105.4PC1 -1392 · PC2 22.22PC1 551.6 · PC2 -407.9PC1 -630.7 · PC2 -241.8PC1 447.2 · PC2 -438.8PC1 -1269 · PC2 -58.76PC1 -938.9 · PC2 74.21PC1 1455 · PC2 -260.7PC1 -1357 · PC2 -93.35PC1 -1515 · PC2 -102.4PC1 -1275 · PC2 -56.21PC1 -1322 · PC2 -209.4PC1 -1456 · PC2 -27.41PC1 -57.86 · PC2 1175PC1 -229.8 · PC2 -404PC1 -1437 · PC2 42.56PC1 -1176 · PC2 305.7PC1 1503 · PC2 -178.7PC1 -760.4 · PC2 -117.8PC1 773.8 · PC2 -709.8PC1 -775.3 · PC2 -431.8PC1 2247 · PC2 140.2PC1 -1366 · PC2 -337.4PC1 2249 · PC2 144.7PC1 -1289 · PC2 -298.4PC1 2303 · PC2 153.7PC1 -1555 · PC2 -330.9PC1 -1285 · PC2 -200.6PC1 -1152 · PC2 -270.8PC1 -439 · PC2 -191.2PC1 -1310 · PC2 -214.5PC1 1760 · PC2 -148PC1 -1694 · PC2 -174.9PC1 -1693 · PC2 -227.8PC1 -43.94 · PC2 -11.76PC1 -1080 · PC2 -197.8PC1 410.5 · PC2 -590.9PC1 -1583 · PC2 -171.4PC1 -1299 · PC2 -236.2PC1 -699.5 · PC2 -106.5PC1 -1494 · PC2 -194.1PC1 1375 · PC2 -329PC1 -205.2 · PC2 808.4PC1 -1144 · PC2 355.8PC1 -764.9 · PC2 925.2PC1 -720.1 · PC2 611.6PC1 1428 · PC2 821.7PC1 -1416 · PC2 218.1PC1 2086 · PC2 177PC1 1651 · PC2 -45.63PC1 2269 · PC2 194.7PC1 2166 · PC2 90.33PC1 1981 · PC2 89.17PC1 2195 · PC2 132.1PC1 2280 · PC2 196.8PC1 396.9 · PC2 1052PC1 -1589 · PC2 -36.16PC1 -764.9 · PC2 925.2PC1 -1396 · PC2 -46.19PC1 1622 · PC2 -45.27PC1 -374.8 · PC2 -1240PC1 631.8 · PC2 -230.3PC1 2017 · PC2 218PC1 2261 · PC2 137.5PC1 2163 · PC2 27.9PC1 1809 · PC2 -320.9PC1 1919 · PC2 263.4PC1 970.1 · PC2 1081PC1 -1471 · PC2 80.89PC1 2024 · PC2 147.5PC1 1301 · PC2 -166.5PC1 2186 · PC2 180.6PC1 2168 · PC2 89.2PC1 1974 · PC2 59.04PC1 2097 · PC2 14.5PC1 2204 · PC2 203.4PC1 -671.7 · PC2 -392.3PC1 -204.7 · PC2 584.8PC1 -510.1 · PC2 671PC1 1273 · PC2 -487.7PC1 -1238 · PC2 -232.9PC1 -254.8 · PC2 61.25PC1 -1173 · PC2 93.36PC1 -104.3 · PC2 -574.7PC1 -988.8 · PC2 -334.5PC1 -586 · PC2 370.3PC1 -934.9 · PC2 468.6PC1 669.9 · PC2 -608.9PC1 2323 · PC2 110.6PC1 -124.5 · PC2 1.088PC1 756.9 · PC2 -638.4PC1 1869 · PC2 318.4PC1 1839 · PC2 -355PC1 13.63 · PC2 -29.62PC1 -463.4 · PC2 -373.7PC1 730.9 · PC2 98.88PC1 2217 · PC2 -55.53PC1 -461.9 · PC2 -63.19PC1 87.79 · PC2 -611.8PC1 1427 · PC2 279PC1 1622 · PC2 233.2PC1 1976 · PC2 -167PC1 -830.8 · PC2 -202.4PC1 800.8 · PC2 -194.5PC1 -678.1 · PC2 -34.27PC1 1532 · PC2 -308.4PC1 861.6 · PC2 -483.9PC1 -734.6 · PC2 82.53PC1 2243 · PC2 164.9PC1 1822 · PC2 -473PC1 559.1 · PC2 -30.42PC1 1329 · PC2 -238.6PC1 857 · PC2 87.79PC1 1048 · PC2 -647.1PC1 -1126 · PC2 -187.5PC1 667.3 · PC2 -80.12PC1 -382.7 · PC2 -370.7PC1 -1236 · PC2 -152.2PC1 596.2 · PC2 -336.3PC1 -552.7 · PC2 -432.9PC1 -476.1 · PC2 -34.42PC1 1676 · PC2 41.26PC1 687.5 · PC2 -1024PC1 -102.1 · PC2 10.63PC1 601.2 · PC2 -139.2PC1 1084 · PC2 187.4PC1 1730 · PC2 -369.5PC1 -1215 · PC2 -201.9PC1 242.2 · PC2 -286.6PC1 -1099 · PC2 -127.9PC1 963.6 · PC2 -560.8PC1 253.3 · PC2 -530.3PC1 -903.2 · PC2 5.235PC1 2128 · PC2 113.4PC1 1407 · PC2 -842.3PC1 41.74 · PC2 -59.96PC1 641.9 · PC2 -336.3PC1 2186 · PC2 103.4PC1 -962.1 · PC2 -84.02PC1 1591 · PC2 393.3PC1 163.4 · PC2 108PC1 -396.8 · PC2 87.71PC1 146.2 · PC2 -464.8PC1 1834 · PC2 -28.97PC1 67.44 · PC2 -32.8PC1 -1147 · PC2 -158.4PC1 961.9 · PC2 49.6PC1 259 · PC2 35.4PC1 -1289 · PC2 -148.8PC1 -536.7 · PC2 -395.4PC1 2077 · PC2 28.79PC1 -1297 · PC2 -143.7PC1 1019 · PC2 225.1PC1 -171.3 · PC2 -1.46PC1 -825.4 · PC2 -21.44PC1 -482.1 · PC2 -505.7PC1 1194 · PC2 -313.7PC1 1782 · PC2 -231.7PC1 1167 · PC2 -370.2PC1 1771 · PC2 -212.9PC1 1748 · PC2 -247.4PC1 -419.7 · PC2 123PC1 -338 · PC2 -108.8PC1 -1132 · PC2 15.37PC1 -224.1 · PC2 -53.97PC1 -336.9 · PC2 400.1PC1 1175 · PC2 -214.7PC1 2225 · PC2 89.19PC1 298.4 · PC2 391.2PC1 -464.3 · PC2 489.1PC1 32.76 · PC2 1312PC1 1156 · PC2 -624.3PC1 -472.9 · PC2 768.9PC1 477.2 · PC2 -276PC1 334.4 · PC2 330.2PC1 -68.99 · PC2 -482.4PC1 -248 · PC2 -535.3PC1 805.4 · PC2 -690.2PC1 114.4 · PC2 -550.3PC1 986.7 · PC2 -259.7PC1 757 · PC2 -686.9PC1 -920.4 · PC2 -40.08PC1 -1037 · PC2 -84.54PC1 -1365 · PC2 -63.96PC1 -46.22 · PC2 37.83PC1 -871.2 · PC2 -18.37PC1 60.25 · PC2 -321.4PC1 1122 · PC2 -595.2PC1 -996.8 · PC2 242PC1 -996.7 · PC2 189.2PC1 -353 · PC2 9.517PC1 -937.4 · PC2 52.57PC1 -843.7 · PC2 568.4PC1 1467 · PC2 -554.4PC1 -1073 · PC2 287.9PC1 -974.3 · PC2 456.7PC1 -852.3 · PC2 77.18PC1 -1164 · PC2 94.46PC1 -486.3 · PC2 141.3PC1 -693.3 · PC2 590.7PC1 -374.4 · PC2 -141.2PC1 245.6 · PC2 -174.5PC1 122.1 · PC2 -133.6PC1 518.1 · PC2 -37.41PC1 777 · PC2 -501.7PC1 1397 · PC2 -544.5PC1 750.6 · PC2 -536.9PC1 1477 · PC2 -372.8PC1 1383 · PC2 -520.6PC1 -761.8 · PC2 56.39PC1 -684.7 · PC2 -119.7PC1 -1242 · PC2 -19.76PC1 -223.7 · PC2 -24.23PC1 -658.6 · PC2 135.7PC1 623.3 · PC2 -321.1PC1 2032 · PC2 -159.8PC1 -388.3 · PC2 234PC1 -898.2 · PC2 314.7PC1 -405.9 · PC2 1056PC1 1319 · PC2 -546.5PC1 -640.2 · PC2 410.4PC1 598.3 · PC2 -128.1PC1 142 · PC2 182.7PC1 1012 · PC2 -464.3PC1 682.2 · PC2 -508.8PC1 -333.3 · PC2 956.7PC1 -82.36 · PC2 263.4PC1 312.5 · PC2 -174.8PC1 26.33 · PC2 -278.3PC1 -1347 · PC2 228.2PC1 -990 · PC2 -29.78PC1 464.1 · PC2 -443PC1 138 · PC2 -567.9PC1 -852.9 · PC2 675.4PC1 -632.4 · PC2 144.4PC1 -88.66 · PC2 -415.1PC1 -852.5 · PC2 -211.3PC1 -754.7 · PC2 -224.2PC1 -1296 · PC2 -189.4PC1 -767.3 · PC2 -424.2PC1 -1126 · PC2 -183.6PC1 -1231 · PC2 -170PC1 -537.5 · PC2 -21.49PC1 -511.4 · PC2 -45.59PC1 1807 · PC2 85.23PC1 -599.1 · PC2 -30.92PC1 -753.5 · PC2 -137PC1 295.2 · PC2 -12.39PC1 -542.6 · PC2 -75.64PC1 -186.1 · PC2 936.8PC1 153.9 · PC2 1158PC1 -915.9 · PC2 -307.9PC1 -1236 · PC2 -170.2PC1 -770.1 · PC2 -125.1PC1 -784.5 · PC2 -246.9PC1 -787.5 · PC2 552.7PC1 -1014 · PC2 -212.8PC1 -1148 · PC2 -150.6PC1 -987.9 · PC2 -174.5PC1 -1067 · PC2 -133.5PC1 -1133 · PC2 -148.6PC1 -685.5 · PC2 -123.1PC1 -1610 · PC2 -237.7PC1 270.4 · PC2 -35.8PC1 -1325 · PC2 -167.1PC1 -1188 · PC2 -204.7PC1 -663 · PC2 -140PC1 -982.2 · PC2 -167.3PC1 -959.6 · PC2 257.2PC1 -885.1 · PC2 437.2PC1 -636.2 · PC2 -414.4PC1 -1276 · PC2 -207.2PC1 -1006 · PC2 -250.2PC1 -1404 · PC2 -190.7PC1 -1197 · PC2 -362.9PC1 -1268 · PC2 -182.2PC1 -1364 · PC2 -177.2PC1 -916.5 · PC2 -94.91PC1 -960 · PC2 -113.4PC1 1003 · PC2 -31.65PC1 -1142 · PC2 -127.4PC1 -1097 · PC2 -176PC1 -403.1 · PC2 -122PC1 -872.2 · PC2 -173.5PC1 -628 · PC2 684.2PC1 -396.1 · PC2 962.9PC1 1141 · PC2 -136PC1 1546 · PC2 -127.9PC1 -405.5 · PC2 -42.96PC1 -399.1 · PC2 1166PC1 -1498 · PC2 -147.6PC1 40.51 · PC2 917.8PC1 -1306 · PC2 -219.8PC1 548.3 · PC2 1580PC1 168.3 · PC2 -498.7PC1 135 · PC2 -433.3PC1 -41.7 · PC2 -520.3PC1 -913.5 · PC2 -220.9PC1 -1300 · PC2 -95.16PC1 -475.5 · PC2 -385.7PC1 635.1 · PC2 -600.5PC1 -1415 · PC2 -116.8PC1 -1088 · PC2 579.5PC1 -1728 · PC2 -205.5PC1 -1032 · PC2 205.9PC1 -1360 · PC2 -186PC1 -354.5 · PC2 1166PC1 -459.6 · PC2 -676.8PC1 -551 · PC2 -665.1PC1 -706.5 · PC2 -682PC1 -1754 · PC2 -304.1PC1 -1491 · PC2 -92.66PC1 691.2 · PC2 -260.8PC1 1450 · PC2 -318PC1 -932.7 · PC2 -104.5PC1 -546 · PC2 894.5PC1 -1720 · PC2 -189.4PC1 -566.3 · PC2 730.6PC1 -1475 · PC2 -218.3PC1 54.39 · PC2 1519PC1 116.6 · PC2 -614.3PC1 11.19 · PC2 -549.4PC1 -2.878 · PC2 -591.8PC1 -1158 · PC2 -245.3PC1 -1440 · PC2 -132.8PC1 2088 · PC2 48.67PC1 718 · PC2 -393.8PC1 1413 · PC2 215.7PC1 1945 · PC2 219.2PC1 -580.5 · PC2 -638.3PC1 -1036 · PC2 -761.1PC1 2125 · PC2 181.2PC1 1869 · PC2 150.5PC1 2211 · PC2 170.4PC1 1910 · PC2 26.01PC1 1768 · PC2 70.13PC1 857.3 · PC2 -596.8PC1 497.7 · PC2 122PC1 2095 · PC2 167.9PC1 -1049 · PC2 -634.9PC1 1630 · PC2 96.06PC1 2243 · PC2 158.2PC1 2105 · PC2 192.5PC1 2370 · PC2 162.3PC1 2174 · PC2 114.9PC1 2180 · PC2 85.8PC1 680.5 · PC2 -499.8PC1 1021 · PC2 203.8PC1 2064 · PC2 188.4PC1 -714.3 · PC2 -602.3PC1 -1074 · PC2 -752.2PC1 2089 · PC2 170.2PC1 1908 · PC2 165.1PC1 2166 · PC2 185.9PC1 1984 · PC2 52.83PC1 -386 · PC2 -360.5PC1 -953.6 · PC2 -292.8PC1 -542.8 · PC2 -391PC1 (82.8%)PC2 (12.2%)406 scores
PCA explained variance0%25%50%75%100%PC1: 82.8% (cumulative 82.8%)1PC2: 12.2% (cumulative 95.0%)2PC3: 1.9% (cumulative 96.9%)3PC4: 1.1% (cumulative 98.0%)4PC5: 0.5% (cumulative 98.5%)5PC6: 0.3% (cumulative 98.9%)6PC7: 0.3% (cumulative 99.2%)7PC8: 0.2% (cumulative 99.3%)8PC9: 0.1% (cumulative 99.4%)9PC10: 0.1% (cumulative 99.6%)10cumulative explained variancePC variancecumulativeprincipal component · cumulative (dashed)

Metric interpretation reference

Metric catalog 29
FamilleMétriqueCe qu’elle détecteForte valeur =Faible valeur =Causes typiquesCalcul / score
Intégrité des donnéesNaN ratioDonnées manquantesSpectre corrompuSpectre completErreur acquisition/exportcount(isnan(X)) / X.sizealert = min(1, nan_ratio / 0.05)
Intégrité des donnéesInf countValeurs infiniesCorruptionNormalCalculs invalidescount(isinf(X))alert = min(1, inf_count / 1)
Intégrité des donnéesZero ratioColonnes ou cellules nullesSpectre tronquéNormalExport, saturationcount(X == 0) / count(finite X)alert = min(1, zero_ratio / 0.05)
Amplitude globaleMean reflectanceNiveau moyenTrop clair / fond visibleTrop sombreFond, géométriemean(X finite)alert reuses baseline/shape drift because absolute reflectance ranges are technology-dependent
Amplitude globaleArea under curveIntensité globaleDifférence d'éclairementNormalDistance sondetrapezoid(mean_spectrum, spectral_axis)alert reuses baseline/shape drift because area scale depends on axis and units
Amplitude globalePeak-to-peak (PTP)DynamiqueVariabilité forteSpectre platSaturationmax(mean_spectrum) - min(mean_spectrum)alert increases when dynamic range is abnormally flat
Amplitude globaleVarianceVariabilité spectraleNormal ou hétérogèneSpectre platMauvais contactvar(X finite)alert increases when variance/dynamic range is abnormally flat
BruitNoise RMSBruit haute fréquenceBruitéStableLampe, détecteurmedian MAD(second derivative) * 1.4826 / sqrt(6)alert = noise_rms / signal_scale, saturated at 5%
BruitSNRQualité signalBon signalMauvais signalAcquisitionmean(abs(X)) / noise_rmsalert decreases with SNR dB; >=40 dB is treated as low alert
BruitBandwise SNRBruit localiséZone fiableZone problématiqueDétecteurmin(abs(mean_spectrum) / local second-derivative noise)alert decreases with worst-band SNR dB; >=35 dB is treated as low alert
Artefacts locauxSpike countPics étroitsArtefactsSpectre propreCosmic rays, splicecount robust outliers in second derivativealert follows spike_rate, saturated at 1%
Artefacts locauxSpike rateDensité de picsSpectre suspectNormalInterpolationspike_count / (n_samples * (n_features - 2))alert = min(1, spike_rate / 0.01)
Artefacts locauxJump countDiscontinuitésRaccord détecteurContinuSplicecount robust outliers in first derivativealert follows jump_rate, saturated at 1%
Artefacts locauxJump rateFréquence de sautsProblème spectralNormalCalibrationjump_count / (n_samples * (n_features - 1))alert = min(1, jump_rate / 0.01)
Artefacts locauxClip fractionSaturationClippingNormalDétecteur saturéfraction of finite cells equal to repeated min/max extremaalert = min(1, clip_fraction / 0.01)
Forme spectraleBaseline slopePente globaleDériveStableÉclairementlinear slope of mean_spectrum over normalized axisalert = abs(slope / signal_scale), saturated at 0.5
Forme spectraleCurvature RMSCourbureForme inhabituelleLisseFond, splicemedian RMS(second derivative per spectrum)alert = curvature_rms / signal_scale, saturated at 1%
Forme spectraleD1 RMSVariabilité localeSpectre structuréPlatBiologie ou artefactmedian RMS(first derivative per spectrum)alert = d1_rms / signal_scale, saturated at 5%
Outliers multivariésPCA Q (SPE)Non expliqué par PCASpectre atypiqueConformeArtefact, mélangep95(Q/SPE residual) / median(Q/SPE residual)alert = min(1, pca_q_ratio / 8)
Outliers multivariésHotelling T²Extrême dans PCAExtrême mais cohérentCentralVariabilité naturellep95(Hotelling T2) / median(Hotelling T2)alert = min(1, hotelling_t2_ratio / 8)
Outliers multivariésMahalanobis HDistance au nuageOutlier globalPopulation normaleDomaine différentp95(sqrt(T2)) / median(sqrt(T2))alert = min(1, mahalanobis_h_ratio / 4)
Comparaison à référenceRMS to mean spectrumDistance moyenneSpectre différentTypiqueDomain shiftp95 RMS distance to dataset mean spectrumalert = RMS_p95 / signal_scale, saturated at 25%
Comparaison à référenceSpectral Angle Mapper (SAM)Différence de formeForme différenteSimilaireFond, géométriep95 spectral angle to dataset mean spectrumalert = min(1, SAM_p95 / 0.35 rad)
RépétabilitéRMS intra-IDReproductibilitéMauvaise répétabilitéStablePositionnementmedian RMS distance to repeated-sample centroidalert = RMS_intra_ID / signal_scale, saturated at 10%
RépétabilitéSAM intra-IDVariation de formeInstableStableAcquisitionmedian SAM to repeated-sample centroidalert = min(1, SAM_intra_ID / 0.15 rad)
RépétabilitéCV intra-IDVariabilité interneMauvais contrôleStableOpérateurmedian within-ID band CValert = min(1, CV_intra_ID / 0.25)
Structure du datasetPCA score densityClustersSous-populationsHomogèneLots différents1 / median kNN distance in PCA score spacealert follows density_cv/profile structure complexity, not raw density alone
Structure du datasetLocal Outlier Factor (LOF)Anomalie localeSpectre isoléPopulation normaleCas raresp95 approximate LOF from PCA-score kNN distancesalert = min(1, max(0, LOF_p95 - 1) / 2)
Structure du datasetIsolation Forest scoreAnomalie globaleSpectre atypiqueNormalDiverses causesp95 IsolationForest anomaly score on PCA scoresalert follows structure complexity; raw score is implementation-dependent
Technology-specific extensions
TechnologieAdaptations / métriquesAnomalies cibléesCommentaire pratique
UV-Vis 300-1000 nmBaseline, pente globale, dérive aux bords 300-350 et 900-1000; métriques par zonesLumière parasite, mauvais blanc, saturation, faible signal aux extrémitésLes bords sont souvent instables; calculer aussi des scores edge/middle.
UV-Vis 300-1000 nmSaturation / clipping proche absorbance max ou réflectance maxSignal écrêtéTrès important si absorption forte.
UV-Vis 300-1000 nmRed-edge, position de maximum, ratios de bandes si végétalDécalage biologique ou artefact optiqueAide à distinguer changement réel et problème d'acquisition.
UV-Vis 300-1000 nmSmoothness / roughness indexBruit haute fréquenceSouvent plus informatif que le SNR seul.
MIR / ATR-FTIRATR contact quality index: intensité globale, aire totale, profondeur des bandes clésMauvais contact cristal-échantillonCrucial: beaucoup d'anomalies viennent du contact ATR.
MIR / ATR-FTIRCO2 / H2O atmospheric bandsMauvaise correction atmosphériquePics parasites fréquents.
MIR / ATR-FTIRBaseline curvature / rubber-band residualDiffusion, contact, dérive baselineTrès utile avant PCA.
MIR / ATR-FTIRPeak position shiftMauvais alignement spectral / calibrationImportant en FTIR car de petits shifts comptent.
MIR / ATR-FTIRBand area ratios sur bandes connuesSpectre chimiquement incohérentÀ adapter par matrice: polysaccharides, protéines, lipides, etc.
HS-MSTotal Ion Current (TIC), Base Peak Intensity (BPI)Injection faible, ionisation instableÉquivalent MS du niveau global spectral.
HS-MSNombre de pics détectésSpectre pauvre ou trop bruitéTrop peu = mauvais signal; trop = bruit/contamination.
HS-MSMass accuracy / m/z driftProblème calibration masseFondamental en HRMS.
HS-MSRetention time drift si LC/GC-MSDérive chromatographiqueÀ suivre sur standards/QC pools.
HS-MSBlank contamination scoreContaminants / carry-overComparer échantillons vs blancs.
HS-MSInternal standard CVVariabilité instrumentaleTrès robuste si standards disponibles.
HS-MSMissingness par featureInstabilité de détectionCrucial pour filtrer les variables.
Avec répétitionsRMS intra-échantillonRépétabilité globaleApplicable à toutes les technologies.
Avec répétitionsSAM / corrélation intra-échantillonRépétabilité de formeTrès utile pour spectres.
Avec répétitionsCV intra-échantillon par bande / featureRépétabilité localeDétecte les zones instables.
Avec répétitionsICC ou variance componentsPart variance échantillon vs techniqueTrès utile si plusieurs répétitions par sample.
Avec répétitionsDistance au centroïde intra-IDRépétition aberrantePermet de flagger la mauvaise répétition plutôt que le sample entier.
Bug-hunting / supervised audits
Famille de bug potentielMéthodes à ajouterCe que ça détecteÉtat dans l’explorateur
Shift spectral globalCorrélation spectre moyen inter-dataset, DTW, cross-correlation, comparaison positions de picsDécalage en longueur d'onde, mauvais alignement, interpolation différentePartiellement calculé: cross-correlation lag et dispersion des positions de pics vs spectre moyen.
Baseline / offset / gainRégression chaque spectre vs spectre moyen: x = a + b ref + residual; suivi de a, b, RMS résiduelOffset additif, effet multiplicatif, dérive de baselineCalculé dans reference.affine_*.
Mélange de lignes / mauvais appariement X-M-YVérification index, hash des lignes, duplication ID, distance spectrale intra-ID, labels incohérentsLignes mélangées, metadata mal alignées, Y attribué au mauvais spectrePartiellement couvert par répétabilité intra-ID; checks index/hash à ajouter au pipeline canonical.
Fuite d'information / répétitions mal splitéesGroupKFold par sample_id vs StratifiedKFold random; audit des partitions par sample_idPerformance artificiellement bonne due aux répétitionsNécessite splits et benchmark modèle; non calculé par la carte descriptive.
Label bugsÉchantillons proches en X mais Y différents, confident learning, erreurs systématiques FP/FNY inversés, erreurs de saisie, classes ambiguësNécessite Y et/ou modèle; recommandé pour l'explorateur supervisé.
Sous-domaines cachésPCA/UMAP/t-SNE + clustering non supervisé + association avec dataset/Y/date/operatorLots, campagnes, sondes, backgrounds non renseignésPartiellement calculé par structure PCA/LOF; UMAP/t-SNE hors carte statique.
Artefacts localisés inconnusCarte wavelength x dataset: différence moyenne, différence variance, KS par longueur d'ondeRégions spectrales anormales non anticipéesÀ calculer au niveau banque quand plusieurs datasets partagent un axe spectral.
Ruptures instrumentalesDiscontinuités dans dérivées, changepoint detectionSplice, raccord détecteur, saut local non prévuCalculé par jump/spike rates; changepoint plus avancé à ajouter.
Mélange / contamination spectraleNMF / unmixing / reconstruction par convex hullComposante externe: fond, plastique, solNon calculé automatiquement; nécessite hypothèses de composants ou grande bibliothèque.
Features instables mais prédictivesImportance modèle vs instabilité QC par variableModèle qui apprend un artefact plutôt qu'un signal biologiqueNécessite modèle supervisé; recommandé pour rapports de benchmark.

Variables

Targets 4

material_name

target · categorical
material_name classesQuartz SiO_2Quartz SiO_2: 55Calcite CaCO_3Calcite CaCO_3: 33Nontronite Na_0.33Fe_2^3+(Si,…Nontronite Na_0.33Fe_2^3+(Si,Al)_4O_10(OH)_2.H_2O: 33Dolomite CaMg(CO_3)_2Dolomite CaMg(CO_3)_2: 22Fluorite CaF_2Fluorite CaF_2: 22Hematite alpha Fe_2O_3Hematite alpha Fe_2O_3: 22ChloriteChlorite: 22Lepidolite K(Li,Al)3(Si,Al)_4…Lepidolite K(Li,Al)3(Si,Al)_4O_10(F,OH)_2: 22Vermiculite (Mg,Fe^2+,Al)_3(A…Vermiculite (Mg,Fe^2+,Al)_3(Al,Si)_4O_10(OH)_2.4H_2O: 22Kaolinite Al_2Si_2O_5(OH)_4Kaolinite Al_2Si_2O_5(OH)_4: 22+10 more+10 more: 1313
n / missing148 / 0
Classes130
Balance (entropy)0.99
Imbalance ratio5
Top classQuartz SiO_2 (5)

class_label

target · categorical
class_label classesSilicateSilicate: 7676CarbonateCarbonate: 1515SulfateSulfate: 1313OxideOxide: 1212SulfideSulfide: 1010BorateBorate: 66HalideHalide: 55PhosphatePhosphate: 44ArsenateArsenate: 22ElementElement: 22+2 more+2 more: 33
n / missing148 / 0
Classes12
Balance (entropy)0.69
Imbalance ratio76
Top classSilicate (76)

subclass

target · categorical
subclass classesPhyllosilicatePhyllosilicate: 2929TectosilicateTectosilicate: 1919InosilicateInosilicate: 1313NesosilicateNesosilicate: 77nonenone: 66CyclosilicateCyclosilicate: 44SorosilicateSorosilicate: 44
n / missing148 / 66
Classes7
Balance (entropy)0.87
Imbalance ratio7
Top classPhyllosilicate (29)

particle_size

target · categorical
particle_size classesCoarseCoarse: 129129FineFine: 1919
n / missing148 / 0
Classes2
Balance (entropy)0.55
Imbalance ratio7
Top classCoarse (129)

Metadata 4

ecostress_resource_id

metadata · categorical
n / missing148 / 0
Classes148
Balance (entropy)1
Imbalance ratio1
Top classmineral.arsenate.none.coarse.vswir.a-1a.jpl.perkin.spectrum (1)

location

metadata · categorical
location classesUnknown.Unknown.: 1414None.None.: 77USA, California, Kern County,…USA, California, Kern County, Boron.: 55Brazil, Minas Gerais.Brazil, Minas Gerais.: 33USA, Utah, Tooele County, Gol…USA, Utah, Tooele County, Gold Hill.: 22USA, California, San Bernadin…USA, California, San Bernadino County, Near Valley Wells.: 22United Kingdom, England.United Kingdom, England.: 22USA, Colorado.USA, Colorado.: 22Mexico, Chihuahua.Mexico, Chihuahua.: 22USA, California.USA, California.: 22+10 more+10 more: 1414
n / missing148 / 0
Classes113
Balance (entropy)0.95
Imbalance ratio14
Top classUnknown. (14)

sample_description

metadata · categorical
n / missing148 / 0
Classes148
Balance (entropy)1
Imbalance ratio1
Top classParticle size was 125-500um.Collected by: JPL Original ASTER Spectral Library name was jpl.perkin.mineral.arsenate.none.coarse.a01a.spectrum.txt (1)

notes

metadata · categorical
n / missing148 / 0
Classes148
Balance (entropy)1
Imbalance ratio1
Top classmineral.arsenate.none.coarse.vswir.a-1a.jpl.perkin.ancillary.txt (1)
Constant metadata 14
  • categorymineral
  • material_typeMineral
  • instrumentjpl.perkin
  • acquisition_modeHemispherical reflectance
  • signal_typeReflectance (percent)
  • axis_unitWavelength (micrometers)
  • axis_min0.4
  • axis_max2.5
  • n_points_original2,101
  • publication_doi10.1016/j.rse.2019.05.015
  • citationMeerdink et al. 2019, Baldridge et al. 2009
  • licenseCopyright California Institute of Technology / JPL, all rights reserved
  • rights_statusmanual_review_needed
  • usage_scopeprivate_use_only

9 variable(s) omitted (no recorded values).

Alignment

Alignment levelobservation
Sample id availableyes
Samples148
Observations (total)406
Reps per samplemin 1 · mean 2.743 · max 3

Provenance & citation

ContributorECOSTRESS Spectral Library
Origin · url [open]https://speclib.jpl.nasa.gov/download
Origin · url [open]https://speclib.jpl.nasa.gov/
Origin · script [manual]source_to_standard.py — standardization script (maintainer-only)
Publication10.1016/j.rse.2019.05.015 — The ECOSTRESS spectral library version 1.0
Publication10.1016/j.rse.2008.11.007 — The ASTER Spectral Library Version 2.0

Governance & integrity

Tierprivate
LicenseLicenseRef-not-cleared
Permitted useResearch and benchmarking; private use only.
Access policyManual download / private-use-only per source.
RedistributionOfficial ECOSTRESS page requests citation and states copyright/all rights reserved; converted matrices are private/internal until redistribution rights are clarified.
Content version1.0.0
Schema / protocol2.0
Content hashb19bd74826c3bc1f…
Processing hashca8751e24cb86365…
Metadata hashdd4cc50dba2dd3ba…

Load this dataset

# pip install nirs4all-datasets
from nirs4all_datasets import get

# private dataset — export requires a Dataverse token
ds = get("ecostress_mineral_vswir_2101points", token="…")
X, y = ds.x(), ds.y()
print(X.shape, y.shape)

Metadata downloads are available for public datasets only. The dataset bytes are never served here — fetch them from the origin / DOI above.