Improved Dynamic Light Scattering using a adaptive and statistically driven time resolved treatment of correlation data

この研究では、新しいDLS測定およびデータ処理プロセスを説明し評価した。これは、検出器からの光子到着時間データを非常に小さなブロックに切り取り、それぞれが個別のサブ測定として相関されるものだ。 測定プロセスで構築された、相関のある各副測定値から得られる多くの量の統計分布を用いて、10秒の副測定値の終わりに示されるような過渡事象(図1bの8秒から10秒の間)を分類し、残りの定常データ(図1cの0秒から<8秒)に分けて分析する。 その結果、過渡状態と定常状態の相関図ペアとして別々に合計され、それを縮小して過渡状態と定常状態の粒度分布が得られます。 収集されたすべてのデータ(過渡状態と定常状態)が分析され報告されるため、データが拒否されたり、ユーザーから隠されたりすることはなく、多分散かどうかにかかわらず、あらゆるサンプル結果の完全で偏りのない表現が得られます。 さらに、このプロセスは、多くの凝集体が存在するため、サンプルの主要な画分はこれらの大きな成分であると考えるべきである、つまり、凝集体が非常に多くなり、その信号が定常画分になるという限界のケースを本質的に扱うものである27。

また、非常に短い測定サブランに基づき、データ自体の統計に基づく方法で、過渡状態と定常状態のクラスを分類して別々に減らすことにより、短い合計測定時間にわたって定常状態クラス内の変動の統計的に関連した最小化につながり、定常状態DLSデータの精度を直接向上させると同時に、よく振る舞うサンプルの合計測定時間を、市販の装置で現在見られるものより1桁減少することが判明した。

このセクションの残りの部分では、既知のサイズのモデルシステムとしてポリスチレンラテックス粒子の測定を、壊れやすく散乱の少ないサンプルとしてリゾチームの分散を使用して、この技術の開発について説明します。 セクション3では、この技術の利点を示すいくつかのケーススタディについて、セクション4では結論を導き出し、セクション5では使用した方法について説明します。

解析方法

この技術は相互相関測定に同様に適用可能であるが、ほとんどの市販の装置は、以下のように与えられる検出、散乱光子時間系列I(t)の自己相関関数g2(|q|;τ)を測定する、

${g}^{2}(|{\boldsymbol{q}| { })。\tau )=Ⓐ{langle I(t)I(t+tau )\rangle }{langle I(t){http}^{2}$
(3)

ここでτは遅延時間、Iは時間tで測定した検出器の光子カウント/秒で表された強度測定値である。 一次相関関数g1は、Siegert関係1によりg2から求められ、g1に対するcumulants-fit20は、一般に、

${g}^{1}(|{Θboldsymbol{q}}|;\tau )=exp(-Θbar{Gamma }(\tau -Θfrac{{mu }_{2}}{2!}{tau }^{2}+ Cfrac{{Mu }_{3}}{3!}{tau }^{3}+))$$
(4)

where, \(\bar{Gamma },\) is the average, characteristic decay rate over all size-classes in the sample and \({}mu }_{2}/{Thresholdbar{Gamma }}^{2} comments.All size-class of the sample and \({}mu}_{2}) {Thresholdbar{Gamma }}+))$$ {4073> $4073> $4073\これは、相関関数が単一の指数関数的な減衰から離れることを示す2次の多分散性指数(PdI)であり、サンプルの分散を推定することができます。 z平均拡散係数、Dzは、次に、関係式

$$bar{CheetGamma }={|{Cheetboldsymbol{q}}^{2}{D}_{z}$
(5)

と平均動径によって与えられます。 ZAve は、レイノルズ数の低い液体中の球状粒子に対する Stokes-Einstein モデル、式(1)を用いて、Dz から計算されます。 6、ここでηは分散媒粘度、kBはボルツマン定数、Tは分散媒温度(ケルビン)である。

${D}_{z}=theme{k}_{B}T}{3pi \eta {Z}_{Ave}}$
(6)

キュムラントより高い分解能での粒子径分布の推定は相関関数を複数の指数和にフィットさせて与えることができる。 CONTIN28や非負最小二乗法(NNLS)などの多くの可能な逆解法によって達成される。このようなフィットの一般的に非論理的な性質に対処するために、よく実装される2つの例がある。 多分散の場合、Eq. 4 は、D 上の連続分布となり、そこから寄与する粒子の半径または直径の範囲を計算することができます

$${g}^{1}(|{Category boldsymbol{q}}|;\tau )=entaint G(\Gamma )\,exp(\,-enta,\Gamma {rm{tau }})dGamma $$
(7)

Sub measurement length and improved precision

The photon arrival time series is divided into small sub measurements then individually correlated and reduced into sample properties as described in Section 2.2.3.

複数回の測定でDLSデータから得られる量(ZAve、PdI、カウントレートなど)の実験的不確かさは、通常の方法では測定回数の平方根に反比例するが、各サブ測定内の相関図中のノイズとサブ測定長の関係はあまり明らかではない。 図 1a を参照すると、サンプリングされた体積は、有限の幅を持つ照明レーザーと検出パスの交点によって差し引かれる領域で、キュベット内の試料の総体積よりもかなり小さいため、集積時間が長くなると、凝集体が検出体積に拡散する確率、あるいはそこから拡散する確率が高くなり、このセクションでは、得られた量、ZAve および PdI がサブ測定時間の関数としてどのように動作するかを探ります。 目的は、S/Nを維持または改善するために継続時間を最適化することであるが、同時に選択アルゴリズムが各サブ測定を定常状態または過渡状態として分類するのに十分な応答性を維持できるようなサブ測定長にすることである。

図2aは、メーカーにより58〜68nmと指定された流体力学的サイズ範囲を有するポリスチレンラテックス(Thermo-Scientific、3060 A)を、200nmろ過DI水で作った150mM NaClに分散させた一連の測定に対するZAveおよびPdI(18.2 MΩ)。

Figure 2
figure2

(a) ZAveとPdIの分布、サブ測定期間とサブ測定回数の関数として。 記録されたすべてのデータが示されている。すなわち、この図のために選択解除されたデータはない。 考察は本文を参照。 破線は多分散性指数に関するISO規格を示す。 (b)追加の大きな材料を微量含むサンプル(上)、および安定した、よく準備されたサンプル(下)のZAveの関数としての多分散性指数、PdIの例

測定ZAveに対する標準偏差の減少に注意1からの。1×10秒の場合と10×1秒の場合の間の1nmから0.32nmへの測定されたZAveに対する標準偏差の減少に注目してください。青で強調されているのは、DLS測定の精度が、同じ合計統合時間に対してより短いサブ測定の平均を単に使用して増加することを意味します。 同様の挙動は、異なるサイズの粒子の測定でも見られる(補足情報参照)。

この改善のメカニズムは、過渡的な散乱体が検出されたときの相関関数の形式を考えることによって説明することができる。 相関関数はほぼ指数関数的に減衰するが、アフターパルス、ショットノイズ、正規化エラー、そしてもちろん異なるサイズの散乱粒子の検出を含むいくつかのノイズ源によって小さな摂動が生じる21。 相関光散乱を短い時間間隔で記録すると、これらの摂動の振幅が大きくなることがあります。しかし、それぞれがランダムなノイズを含む複数のサブ測定相関関数にわたって平均化すると、最終結果には、同じ時間で記録した相関関数よりもノイズが少なくなりますが、1つの連続トレースとして扱われることになります。 これは非常に重要な結果であり、サブ計測の長さを慎重に設定するだけで、この主要なナノスケール計測モダリティの精度を3倍向上させることができることを示すものである。

さらに、次のセクションで示すように、短いサブ測定長によって、定常データと過渡データの分類も可能になり、DLSの主な批判である粒子半径の6乗に散乱強度が比例すること、つまり、主粒子成分からのデータが歪むか、まれに大きな粒子の存在によってマスクされることさえあることを解決できることが示されます。 実用的には、フィルターの汚れ、一時的な凝集物、洗浄が不十分な実験器具など、より大きな、しばしば不要な画分に起因する測定結果の大きな不確かさを避けるために、綿密なサンプル調製が必要であることを意味する。

Classification of transient and steady state data

先に述べたように、多くの市販DLS装置は、これらの測定のいくつかが何らかのダストリジェクションアルゴリズムに従って結合され、10秒単位のサブ測定時間を使用しますが、サブ測定に過渡現象からの散乱のショートバーストが含まれている場合、信頼できるデータの大きな部分が測定から省かれることがあることを意味しています。 このことは、定常データと過渡データの分類は、より短い相関時間を使用することによっても達成できるかもしれないことを示唆しており、過渡散乱の影響が平均化されないため、サブ測定間の比較もより正確にできるかもしれません。 これらの一連のサブ測定の結果は、次に、セクション2.2で議論したように、サイズ分析を実行する前に自己相関関数の平均を分析することによって結合することができる。 1c.

過渡的な副測定の識別は、サンプルに固有である可能性のある任意に定義された閾値を必要としないように、調査中のサンプルの特性から導き出す必要があります。

凝集体分析は、試料が単分散であることを前提としています。つまり、ZAveとPdIの両方が、サブ測定値の比較に使用できる粒子径の連続的で感度の高い測定値を与えるということです。 PdI は、相関関数が完全な指数関数的減衰から逸脱していることを表します。 これは、相関関数の摂動の直接測定であり、過渡散乱の典型的な結果である相関関数ベースラインのノイズに特に敏感で、したがって、これから示すように、複数のサブ測定からの相関関数を比較するために使用する理想的なパラメータである

このような関係の一例が図2bに示されており、サンプルには凝集材料またはラテックス球の混合物でドープされています(補足情報参照)。 ここで、微量の凝集体を含むサンプルは、測定されたサイズとPdIとの間に正の相関を示し、いくつかのデータポイントは一貫したサイズとPdIでクラスタ化されるが、ドープされていないサンプルはデータの明確なクラスタが示される。 したがって、過渡的なサブ測定は、PdIが予期しない値で存在するものとして識別することができる。 この例では、予期しないとは、所定の副測定値のPdIが定常副測定値を代表しておらず、したがって統計的異常値であることを意味する。 統計的外れ値を特定するための多くの方法が存在し、それぞれが対象の分布の性質とサンプルサイズに応じて長所と短所を持つ。

図3aは、任意に少量のスプリアス物質を含む分散液のPdIの分布を示し、異なるサンプルについてPdIの分布は中心部と幅で変化している。 PdIは定義上、区間に限定され、一般に大きな値に偏ることを考えると、平均や標準偏差のような分布の算術的記述子は適切ではありません。

図3
図3

(a) 集合/汚染サンプルの範囲に対するPdIの分布、過渡粒子の測定を識別するためのサンプル固有の定義の必要性を示しています。 これらの分布は、PdIが偏った分布であることも示しており、そのため、外れ値に対する平均からの3標準偏差の閾値はロバスト性がないであろうことも示している。 (b) リゾチームのサンプルについて、まばらに収集された測定値のヒストグラム。 (a)の最小二乗回帰とガウスモデルを用いたフィッティングでは、十分にサンプリングされたデータセットの統計量を確実に決定できましたが、疎なデータセットへのフィッティングの試みは青で示されており、明らかにサンプリング不足で分布データとの相関が低いことを示しています。 また、個々の値のばらつきを示す散布図も示しています。 160>

離散的なサブ計測の数が十分に多い場合、データのヒストグラムを使用して分布幅を導き出すことができる(図中のガウスフィットを参照のこと)。

サンプルサイズの最適化

外れ値識別法の効率は、データポイントの総数と分布内の外れ値の数の両方に連動している。 一方、低散乱、著しい多分散性、または偽の散乱体を含むことにより、よりノイズの多い相関関数を生成するサンプルでは、外れ値の特定をより確実にするために、より多くのサブ測定が必要になります。

可能なアプローチは、個々のサブ測定結果の広がりを監視するか、これらの値で正規性のテストを実行することですが、これは通常、より多くのデータポイントを取得するために測定を駆動することになります。 代替のアプローチは、測定の統計が適切に定義され、相関関数の摂動が適切に最終結果から平均化されている場合、測定が進むにつれて最終結果となるであろう値を継続的に監視することです。 この場合も,仮説検定を使用して,追加のサブ測定値を収集した後の測定結果を比較し,これらの値が一致すれば,その試料は十分に特性化されており,測定はそれに応じて終了することができる。

このアプローチの例をリゾチームサンプルについて図4aに示しますが、最初に誤った過小評価の粒子径が報告されていますが、その後のサブ測定の収集により安定します。 また、異常値の識別は、より多くのデータが収集されるにつれて測定中に繰り返されます。これは、測定プロセスのいつ記録されたかにかかわらず、一過性の事象がそのように識別されることを意味します。 これは、真のサンプルを代表しているかどうかにかかわらず、最初の測定に基づいてデータを比較する可能性がある他の方法の改善である。

Figure 4
figure 4

(a) 上:リゾチーム試料の測定中に測定したサブ測定数に対して報告した ZAve です。 各報告されたサイズに対する標準誤差の推定値はエラーバーで示されている。 この結果は、当初は不正確で変動しやすいが、十分な量のデータを収集すると安定する。 下段。 データの類似性に関する仮説検定の信頼水準(CL)。ZAveに示された連続した値に対して計算される。 信頼度が閾値に達すると、ZAveに解決可能な差がないと予想されるため、追加のサブ計測の記録を終了することができる。 (b) 上段:検出角度 90°で測定した短い相関時間と長い相関時間を用いた 1 mg/mL リゾチームの測定における強度加重粒度分布。 短いサブ測定では、明らかに大きなサイズ成分が見られますが、これはサンプルの低い散乱強度に関連したノイズアーチファクトです。 下。 長いサブ測定と短いサブ測定を用いた繰り返し測定の相関関数ベースライン。

この結果、ユーザーの介入なしにデータ収集効率が向上し、収集するデータが少ない安定したサンプルの測定は、したがって短時間で完了することができますが、ある程度の不確実性を示す複雑なサンプルは、同等の信頼性を持つ結果を得るために自動的に多くのデータが収集されることになります。

サンプリング最適化

セクション2.2で説明したように、相関関数にはいくつかのノイズ源があり、このノイズの振幅は時間的に依存することがあります。

散乱断面積が小さい、サンプル濃度が低い、周囲の分散媒に対する屈折率の差が小さい、またはそれらの組み合わせによって低散乱特性を示すサンプルについては、相関器時間ビンに入る検出光子が少なく、これは通常、長い相関器遅延時間τにおける相関関数ベースラインのノイズとして現れるでしょう。

  • (2)

    最小のレーザー減衰でも検出される散乱レベルが低い場合、ベースラインノイズを減らすためにサブ測定長を最適化する。

  • (3)

    サブ測定を集め、キュムラント分析を用いて解析する。

  • (5)

    定常状態のサブ計測の相関関数を平均化し、その結果を解析してZAveを報告する。

  • (6)

    上記のようにさらにサブ計測を記録・解析し、新しい最終解答ZAveを記録する。

  • (7)

    このプロセスは、仮説検定を使用して、ステップ(5)と(6)からの前の2つのZAve結果が一致することが判明するまで繰り返される。

  • サンプル特性に対する上記のアルゴリズムの反応を考えると、サブ測定長、収集したデータ量、定常状態の結果から省略するサブ測定はすべてサンプルとデータ品質に依存しており、この方法は、天文学における適応光学の使用からヒントを得て「Adaptive Correlation」と呼ばれている31。

    Leave a Reply