<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE article PUBLIC "-//NLM//DTD JATS (Z39.96) Journal Publishing DTD v1.4 20241031//EN" "JATS-journalpublishing1-4.dtd">
<article xmlns:mml="http://www.w3.org/1998/Math/MathML" xmlns:xlink="http://www.w3.org/1999/xlink" article-type="research-article" dtd-version="1.4" xml:lang="en">
  <front>
    <journal-meta>
      <journal-id journal-id-type="publisher-id">jamp</journal-id>
      <journal-title-group>
        <journal-title>Journal of Applied Mathematics and Physics</journal-title>
      </journal-title-group>
      <issn pub-type="epub">2327-4379</issn>
      <issn pub-type="ppub">2327-4352</issn>
      <publisher>
        <publisher-name>Scientific Research Publishing</publisher-name>
      </publisher>
    </journal-meta>
    <article-meta>
      <article-id pub-id-type="doi">10.4236/jamp.2026.144076</article-id>
      <article-id pub-id-type="publisher-id">jamp-150902</article-id>
      <article-categories>
        <subj-group>
          <subject>Article</subject>
        </subj-group>
        <subj-group>
          <subject>Physics</subject>
          <subject>Mathematics</subject>
        </subj-group>
      </article-categories>
      <title-group>
        <article-title>Research on the Proximal Gradient Method for Composite Optimization Problems under Generalized Smoothness Assumptions</article-title>
      </title-group>
      <contrib-group>
        <contrib contrib-type="author">
          <name name-style="western">
            <surname>Yang</surname>
            <given-names>Lin</given-names>
          </name>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
        <contrib contrib-type="author" corresp="yes">
          <name name-style="western">
            <surname>Xian</surname>
            <given-names>Na</given-names>
          </name>
          <xref ref-type="aff" rid="aff1">1</xref>
        </contrib>
      </contrib-group>
      <aff id="aff1"><label>1</label> Key Laboratory of Optimization Theory and Applications, School of Mathematical Sciences, China West Normal University, Nanchong, China </aff>
      <author-notes>
        <fn fn-type="conflict" id="fn-conflict">
          <p>The authors declare no conflicts of interest regarding the publication of this paper.</p>
        </fn>
      </author-notes>
      <pub-date pub-type="epub">
        <day>01</day>
        <month>04</month>
        <year>2026</year>
      </pub-date>
      <pub-date pub-type="collection">
        <month>04</month>
        <year>2026</year>
      </pub-date>
      <volume>14</volume>
      <issue>04</issue>
      <fpage>1612</fpage>
      <lpage>1626</lpage>
      <history>
        <date date-type="received">
          <day>31</day>
          <month>03</month>
          <year>2026</year>
        </date>
        <date date-type="accepted">
          <day>20</day>
          <month>04</month>
          <year>2026</year>
        </date>
        <date date-type="published">
          <day>23</day>
          <month>04</month>
          <year>2026</year>
        </date>
      </history>
      <permissions>
        <copyright-statement>© 2026 by the authors and Scientific Research Publishing Inc.</copyright-statement>
        <copyright-year>2026</copyright-year>
        <license license-type="open-access">
          <license-p> This article is an open access article distributed under the terms and conditions of the Creative Commons Attribution (CC BY) license ( <ext-link ext-link-type="uri" xlink:href="https://creativecommons.org/licenses/by/4.0/">https://creativecommons.org/licenses/by/4.0/</ext-link> ). </license-p>
        </license>
      </permissions>
      <self-uri content-type="doi" xlink:href="https://doi.org/10.4236/jamp.2026.144076">https://doi.org/10.4236/jamp.2026.144076</self-uri>
      <abstract>
        <p>The proximal gradient method (PGD) is an important approach for solving composite optimization problems consisting of the sum of a smooth function and a nonsmooth function. Classical convergence analysis of PGD typically assumes that the smooth function has a globally Lipschitz continuous gradient. In recent years, researchers have relaxed this assumption from various perspectives, thereby providing theoretical support for the application of PGD to more general problems. In particular, for unconstrained smooth optimization problems, Li <italic>et al.</italic> introduced the concept of <inline-formula><mml:math></mml:math></inline-formula></p>
        <p>ℓ(</p>
        <p>⋅</p>
        <p>)</p>
        <p>-smoothness, studied the convergence rates of classical gradient methods, and showed that under this generalized smoothness condition, the convergence rates of classical gradient methods remain consistent with those under the classical smoothness condition. Nevertheless, existing results are mostly focused on unconstrained smooth optimization, and the corresponding theoretical analysis of PGD for composite optimization problems still requires further development. To this end, this paper further investigates the convergence rates of PGD for solving composite optimization problems within the <inline-formula><mml:math></mml:math></inline-formula></p>
        <p>ℓ(</p>
        <p>⋅</p>
        <p>)</p>
        <p>-smoothness framework. Under the assumption that the smooth component in the composite optimization problem is convex, we prove that the sequence of function values generated by the constant-stepsize PGD under-smoothness achieves a convergence rate of <inline-formula><mml:math></mml:math></inline-formula></p>
        <p>O(</p>
        <p>1/k</p>
        <p>)</p>
        <p>.</p>
      </abstract>
      <kwd-group kwd-group-type="author-generated" xml:lang="en">
        <kwd>Generalized Smoothness</kwd>
        <kwd>Proximal Gradient Method</kwd>
        <kwd>Composite Optimization Problem</kwd>
      </kwd-group>
    </article-meta>
  </front>
  <body>
    <sec id="sec1">
      <title>1. Introduction</title>
      <p>This paper considers the following composite convex optimization problem:</p>
      <disp-formula id="FD1">
        <label>(1)</label>
        <mml:math>
          <mml:mrow>
            <mml:munder>
              <mml:mrow>
                <mml:mi>min</mml:mi>
              </mml:mrow>
              <mml:mrow>
                <mml:mi>x</mml:mi>
                <mml:mo>∈</mml:mo>
                <mml:msup>
                  <mml:mi>R</mml:mi>
                  <mml:mi>d</mml:mi>
                </mml:msup>
              </mml:mrow>
            </mml:munder>
            <mml:mi>F</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mi>x</mml:mi>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>=</mml:mo>
            <mml:mi>f</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mi>x</mml:mi>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>+</mml:mo>
            <mml:mi>g</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mi>x</mml:mi>
              <mml:mo>)</mml:mo>
            </mml:mrow>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>where <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is a proper closed convex function that is differentiable on the open effective domain <inline-formula><mml:math><mml:mrow><mml:mi mathvariant="script"> X </mml:mi><mml:mo> = </mml:mo><mml:mtext> dom </mml:mtext><mml:mtext>   </mml:mtext><mml:mi> f </mml:mi></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mi> g </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is a proper closed convex function satisfying <inline-formula><mml:math display="inline"><mml:mrow><mml:mtext> dom </mml:mtext><mml:mtext>   </mml:mtext><mml:mi> g </mml:mi><mml:mo> ⊆ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> .</p>
      <p>Problem (1) has wide applications in fields such as compressed sensing, sparse phase retrieval [<xref ref-type="bibr" rid="B1">1</xref>][<xref ref-type="bibr" rid="B2">2</xref>], network quantization [<xref ref-type="bibr" rid="B3">3</xref>], and machine learning. Currently, researchers have proposed various classical methods for solving problem (1), including the subgradient algorithm, splitting algorithms [<xref ref-type="bibr" rid="B4">4</xref>], and the proximal gradient method [<xref ref-type="bibr" rid="B5">5</xref>].</p>
      <p>The proximal gradient method (PGD) combines gradient descent with the proximal operator to solve optimization problems with nonsmooth regularization terms by decomposing complex objective functions. Its iterative scheme is as follows:</p>
      <disp-formula id="FD2">
        <mml:math>
          <mml:mrow>
            <mml:msup>
              <mml:mi>x</mml:mi>
              <mml:mrow>
                <mml:mi>t</mml:mi>
                <mml:mo>+</mml:mo>
                <mml:mn>1</mml:mn>
              </mml:mrow>
            </mml:msup>
            <mml:mo>=</mml:mo>
            <mml:msub>
              <mml:mrow>
                <mml:mtext>prox</mml:mtext>
              </mml:mrow>
              <mml:mrow>
                <mml:msub>
                  <mml:mi>λ</mml:mi>
                  <mml:mi>t</mml:mi>
                </mml:msub>
                <mml:mo>,</mml:mo>
                <mml:mi>g</mml:mi>
              </mml:mrow>
            </mml:msub>
            <mml:mrow>
              <mml:mo>{</mml:mo>
              <mml:mrow>
                <mml:msup>
                  <mml:mi>x</mml:mi>
                  <mml:mi>t</mml:mi>
                </mml:msup>
                <mml:mo>−</mml:mo>
                <mml:mo>∇</mml:mo>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>}</mml:mo>
            </mml:mrow>
            <mml:mo>,</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>where <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> λ </mml:mi><mml:mi> t </mml:mi></mml:msub><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> is the step size parameter, and <inline-formula><mml:math><mml:mrow><mml:msub><mml:mrow><mml:mtext> prox </mml:mtext></mml:mrow><mml:mrow><mml:msub><mml:mi> λ </mml:mi><mml:mi> t </mml:mi></mml:msub><mml:mo> , </mml:mo><mml:mi> g </mml:mi></mml:mrow></mml:msub></mml:mrow></mml:math></inline-formula> denotes the proximal operator of the function <inline-formula><mml:math><mml:mi> g </mml:mi></mml:math></inline-formula> defined as</p>
      <disp-formula id="FD3">
        <mml:math>
          <mml:mrow>
            <mml:msub>
              <mml:mrow>
                <mml:mtext>prox</mml:mtext>
              </mml:mrow>
              <mml:mrow>
                <mml:msub>
                  <mml:mi>λ</mml:mi>
                  <mml:mi>t</mml:mi>
                </mml:msub>
                <mml:mo>,</mml:mo>
                <mml:mi>g</mml:mi>
              </mml:mrow>
            </mml:msub>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mi>z</mml:mi>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>=</mml:mo>
            <mml:mtext>arg</mml:mtext>
            <mml:munder>
              <mml:mrow>
                <mml:mtext>min</mml:mtext>
              </mml:mrow>
              <mml:mrow>
                <mml:mi>x</mml:mi>
                <mml:mo>∈</mml:mo>
                <mml:msup>
                  <mml:mi>ℝ</mml:mi>
                  <mml:mi>d</mml:mi>
                </mml:msup>
              </mml:mrow>
            </mml:munder>
            <mml:mrow>
              <mml:mo>{</mml:mo>
              <mml:mrow>
                <mml:mi>g</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
                <mml:mo>+</mml:mo>
                <mml:mfrac>
                  <mml:mn>1</mml:mn>
                  <mml:mrow>
                    <mml:mn>2</mml:mn>
                    <mml:msub>
                      <mml:mi>λ</mml:mi>
                      <mml:mi>t</mml:mi>
                    </mml:msub>
                  </mml:mrow>
                </mml:mfrac>
                <mml:msup>
                  <mml:mrow>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:mi>x</mml:mi>
                        <mml:mo>−</mml:mo>
                        <mml:mi>z</mml:mi>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                  </mml:mrow>
                  <mml:mn>2</mml:mn>
                </mml:msup>
              </mml:mrow>
              <mml:mo>}</mml:mo>
            </mml:mrow>
            <mml:mo>.</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>In the convergence theory analysis of traditional PGD, it is often required that the gradient satisfy Lipschitz continuity. Under this smoothness condition, if <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is convex, the algorithm can achieve a sublinear convergence rate of <inline-formula><mml:math><mml:mrow><mml:mi> O </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mn> 1 </mml:mn><mml:mo> / </mml:mo><mml:mi> k </mml:mi></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> .</p>
      <p>However, the classical smoothness condition of gradient Lipschitz continuity is relatively strict. For functions with rapidly changing curvature or uneven local geometric structures, this assumption is often difficult to satisfy. Particularly in machine learning and large-scale optimization, many objective functions, although differentiable or even twice differentiable, may not have globally Lipschitz continuous gradients. Even in some standard models, the global smoothness constant may be unbounded [<xref ref-type="bibr" rid="B6">6</xref>], such as the <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> ℓ </mml:mi><mml:mn> 2 </mml:mn></mml:msub></mml:mrow></mml:math></inline-formula> -regression function. Additionally, when the function <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is an augmented Lagrangian function or the dual function of the original problem (which is not necessarily uniformly convex), the objective function may also exhibit nonsmooth or non-uniformly smooth characteristics [<xref ref-type="bibr" rid="B7">7</xref>][<xref ref-type="bibr" rid="B8">8</xref>]. Therefore, how to establish algorithm convergence theory under conditions weaker than classical smoothness remains an important question.</p>
      <p>Significant progress has been made in research on weakening the classical smoothness assumption. In 2020, Zhang <italic>et al.</italic> [<xref ref-type="bibr" rid="B9">9</xref>], based on an in-depth study of the training process of deep neural networks such as LSTM [<xref ref-type="bibr" rid="B10">10</xref>] and ResNet [<xref ref-type="bibr" rid="B11">11</xref>], first proposed a non-uniform smoothness condition—<inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mn> 0 </mml:mn></mml:msub><mml:mo> , </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 1 </mml:mn></mml:msub></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness—to characterize the dependence between the variation of the function gradient and the gradient norm. Compared with the classical smoothness condition of gradient Lipschitz continuity, this type of condition allows the local smoothness degree to vary with the position of the iteration point or the gradient norm, thus covering a broader class of functions, such as univariate polynomials and exponential functions. Under this generalized smoothness condition, Zhang <italic>et al.</italic> proved the convergence rate of gradient clipping [<xref ref-type="bibr" rid="B12">12</xref>] and demonstrated its advantages over gradient descent methods in neural network training. Since the introduction of this generalized smoothness condition, related research has been extensively developed in various fields, including minimax optimization [<xref ref-type="bibr" rid="B13">13</xref>], bilevel optimization [<xref ref-type="bibr" rid="B14">14</xref>], and variational inequalities [<xref ref-type="bibr" rid="B15">15</xref>].</p>
      <p>On this basis, Chen <italic>et al.</italic> [<xref ref-type="bibr" rid="B16">16</xref>] further proposed a more general class of symmetric generalized smoothness conditions—<inline-formula><mml:math><mml:mi> α </mml:mi></mml:math></inline-formula> -symmetric <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mn> 0 </mml:mn></mml:msub><mml:mo> , </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 1 </mml:mn></mml:msub></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness. This concept generalizes existing smoothness definitions and covers many mainstream machine learning problems and important function classes, such as distributionally robust optimization [<xref ref-type="bibr" rid="B17">17</xref>][<xref ref-type="bibr" rid="B18">18</xref>], higher-order polynomials, and exponential functions. Under this framework, the researchers established corresponding descent lemmas for different values of <inline-formula><mml:math><mml:mi> α </mml:mi></mml:math></inline-formula> . On this basis, to solve non-convex optimization problems, Chen <italic>et al.</italic> designed several deterministic normalized gradient descent algorithms [<xref ref-type="bibr" rid="B19">19</xref>], which achieve an optimal complexity of <inline-formula><mml:math><mml:mrow><mml:mi> O </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> ϵ </mml:mi><mml:mrow><mml:mo> − </mml:mo><mml:mn> 2 </mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Meanwhile, they found that under the stochastic setting, the classic variance reduction algorithm SPIDER [<xref ref-type="bibr" rid="B20">20</xref>] can also achieve the optimal sample complexity of <inline-formula><mml:math><mml:mrow><mml:mi> O </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> ϵ </mml:mi><mml:mrow><mml:mo> − </mml:mo><mml:mn> 3 </mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> .</p>
      <p>In the same year, Li <italic>et al.</italic> [<xref ref-type="bibr" rid="B21">21</xref>] also generalized the <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mn> 0 </mml:mn></mml:msub><mml:mo> , </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 1 </mml:mn></mml:msub></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness condition by replacing the original affine function <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mn> 0 </mml:mn></mml:msub><mml:mo> + </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 1 </mml:mn></mml:msub><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mtext>   </mml:mtext><mml:mo> ⋅ </mml:mo><mml:mtext>   </mml:mtext></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> with a more general non-decreasing continuous function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mo> ⋅ </mml:mo><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> to characterize the dependence between the norm of the Hessian matrix and the gradient norm, thereby proposing a more generalized smoothness concept—<inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mo> ⋅ </mml:mo><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness. That is, there exists a non-decreasing continuous function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mo> ⋅ </mml:mo><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> such that <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> satisfies</p>
      <disp-formula id="FD4">
        <mml:math>
          <mml:mrow>
            <mml:mrow>
              <mml:mo>‖</mml:mo>
              <mml:mrow>
                <mml:msup>
                  <mml:mo>∇</mml:mo>
                  <mml:mn>2</mml:mn>
                </mml:msup>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>‖</mml:mo>
            </mml:mrow>
            <mml:mo>≤</mml:mo>
            <mml:mi>ℓ</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mrow>
                <mml:mrow>
                  <mml:mo>‖</mml:mo>
                  <mml:mrow>
                    <mml:mo>∇</mml:mo>
                    <mml:mi>f</mml:mi>
                    <mml:mrow>
                      <mml:mo>(</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>)</mml:mo>
                    </mml:mrow>
                  </mml:mrow>
                  <mml:mo>‖</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>.</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>This generalization significantly expands the applicability of the generalized smoothness theory, enabling researchers to handle function classes with more complex curvature variations. Based on this new framework, Li <italic>et al.</italic> systematically analyzed the convergence rates of gradient descent methods in convex, strongly convex, and non-convex settings. Notably, under the condition that the objective function is convex, they further proved that Nesterov’s accelerated gradient method [<xref ref-type="bibr" rid="B22">22</xref>] achieves an optimal computational complexity of <inline-formula><mml:math><mml:mrow><mml:mi> O </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> ϵ </mml:mi><mml:mrow><mml:mo> − </mml:mo><mml:mn> 0.5 </mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , which exactly matches the optimal bound under the classical smoothness condition. In addition, they also conducted an in-depth study of stochastic non-convex optimization problems and, under the assumption of bounded variance, proved that stochastic gradient descent achieves an optimal complexity of <inline-formula><mml:math><mml:mrow><mml:mi> O </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> ϵ </mml:mi><mml:mrow><mml:mo> − </mml:mo><mml:mn> 4 </mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , which also matches its optimal bound under the classical smoothness condition.</p>
      <sec id="sec1dot1">
        <title>Related Work</title>
        <p>Overall, existing literature mainly focuses on smooth unconstrained problems, while studies for composite optimization problems are relatively limited. In particular, for the proximal gradient method, a fundamental algorithm for solving composite optimization problems, its theoretical analysis under the generalized smooth framework remains incomplete. Although the convergence analysis of proximal gradient methods based on the Kurdyka-Łojasiewicz (KL) property has successfully extended the theoretical framework to non-convex and non-globally Lipschitz settings [<xref ref-type="bibr" rid="B8">8</xref>], such methods still have obvious limitations: their convergence relies on line search strategies to ensure iterative descent, and they can only yield a unified sublinear convergence rate determined by the KL exponent, failing to recover the classical exact convergence rate under convex structures. Therefore, it is necessary to re-examine the algorithmic theory for optimization problems under generalized smoothness conditions and establish a systematic analysis framework applicable to proximal gradient algorithms.</p>
        <p>Against the above background, this paper focuses on the composite optimization problem (1) under generalized smoothness conditions, and systematically studies the convergence rate of the PGD. For problem (1), we rigorously establish the achievable convergence rate of the PGD method with a constant step size, provided that the function <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smooth and convex. This result shows that the PGD method can still retain the same convergence rate as that under the classical Lipschitz smoothness assumption, even under the weaker generalized smoothness condition.</p>
      </sec>
    </sec>
    <sec id="sec2">
      <title>2. Preliminaries</title>
      <p>This paper mainly conducts research in the finite-dimensional Euclidean space <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> . Let <inline-formula><mml:math><mml:mrow><mml:mi mathvariant="script"> X </mml:mi><mml:mo> ⊆ </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> be a non-empty convex set. For any <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> , the inner product is denoted by <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> 〈 </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi></mml:mrow><mml:mo> 〉 </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , and the induced norm is defined as <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mi> x </mml:mi><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msqrt><mml:mrow><mml:mrow><mml:mo> 〈 </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> x </mml:mi></mml:mrow><mml:mo> 〉 </mml:mo></mml:mrow></mml:mrow></mml:msqrt></mml:mrow></mml:math></inline-formula> . In this thesis, <inline-formula><mml:math><mml:mrow><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> R </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> denotes the Euclidean ball centered at <inline-formula><mml:math><mml:mi> x </mml:mi></mml:math></inline-formula> with radius <inline-formula><mml:math><mml:mi> R </mml:mi></mml:math></inline-formula> .</p>
      <p><bold>Definition 1</bold>(<inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smoothness [<xref ref-type="bibr" rid="B21">21</xref>]). Let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be a real-valued differentiable function. If there exists a non-decreasing continuous function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> such that the spectral norm of the Hessian matrix of <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> satisfies </p>
      <disp-formula id="FD5">
        <mml:math>
          <mml:mrow>
            <mml:mrow>
              <mml:mo>‖</mml:mo>
              <mml:mrow>
                <mml:msup>
                  <mml:mo>∇</mml:mo>
                  <mml:mn>2</mml:mn>
                </mml:msup>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>‖</mml:mo>
            </mml:mrow>
            <mml:mo>≤</mml:mo>
            <mml:mi>ℓ</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mrow>
                <mml:mrow>
                  <mml:mo>‖</mml:mo>
                  <mml:mrow>
                    <mml:mo>∇</mml:mo>
                    <mml:mi>f</mml:mi>
                    <mml:mrow>
                      <mml:mo>(</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>)</mml:mo>
                    </mml:mrow>
                  </mml:mrow>
                  <mml:mo>‖</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>)</mml:mo>
            </mml:mrow>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>almost everywhere on <inline-formula><mml:math><mml:mi mathvariant="script"> X </mml:mi></mml:math></inline-formula> (with respect to the Lebesgue measure), then <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is called an <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smooth function.</p>
      <p><bold>Remark</bold><bold>.</bold> When the function <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> is a constant function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> μ </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mi> L </mml:mi></mml:mrow></mml:math></inline-formula> , the definition of <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smoothness degenerates to the classical smoothness definition; when <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> is an affine function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> μ </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 0 </mml:mn></mml:msub><mml:mo> + </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 1 </mml:mn></mml:msub><mml:mi> μ </mml:mi></mml:mrow></mml:math></inline-formula> , the <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smoothness corresponds to the <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mn> 0 </mml:mn></mml:msub><mml:mo> , </mml:mo><mml:msub><mml:mi> L </mml:mi><mml:mn> 1 </mml:mn></mml:msub></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness definition [<xref ref-type="bibr" rid="B9">9</xref>].</p>
      <p><bold>Definition 2</bold>((<inline-formula><mml:math display="inline"><mml:mi> r </mml:mi></mml:math></inline-formula> , <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> )-smoothness). Let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be a real-valued differentiable function. Suppose there exist a non-decreasing continuous function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> and a non-increasing continuous function <inline-formula><mml:math><mml:mrow><mml:mi> r </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> such that</p>
      <p>1) <inline-formula><mml:math><mml:mrow><mml:mo> ∀ </mml:mo><mml:mi> x </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ⊆ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> ;</p>
      <p>2) <inline-formula><mml:math><mml:mrow><mml:mo> ∀ </mml:mo><mml:msub><mml:mi> x </mml:mi><mml:mn> 1 </mml:mn></mml:msub><mml:mo> , </mml:mo><mml:msub><mml:mi> x </mml:mi><mml:mn> 2 </mml:mn></mml:msub><mml:mo> ∈ </mml:mo><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> x </mml:mi><mml:mn> 1 </mml:mn></mml:msub></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> − </mml:mo><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> x </mml:mi><mml:mn> 2 </mml:mn></mml:msub></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> x </mml:mi><mml:mn> 1 </mml:mn></mml:msub><mml:mo> − </mml:mo><mml:msub><mml:mi> x </mml:mi><mml:mn> 2 </mml:mn></mml:msub></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> ;</p>
      <p>Then <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is called an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth function.</p>
      <p><bold>Remark</bold><bold>.</bold> Here, the function <inline-formula><mml:math><mml:mrow><mml:mi> r </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is assumed to be nonincreasing and the function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is assumed to be nondecreasing. This restriction is usually without loss of generality. When <inline-formula><mml:math><mml:mi> r </mml:mi></mml:math></inline-formula> and <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> do not satisfy the required monotonicity, the desired monotonicity can be achieved by the following construction technique:</p>
      <p>1) Replace the original function <inline-formula><mml:math><mml:mi> r </mml:mi></mml:math></inline-formula> with <inline-formula><mml:math><mml:mrow><mml:mover accent="true"><mml:mi> r </mml:mi><mml:mo> ^ </mml:mo></mml:mover><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mrow><mml:mtext> inf </mml:mtext></mml:mrow><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> ≤ </mml:mo><mml:mi> v </mml:mi><mml:mo> ≤ </mml:mo><mml:mi> u </mml:mi></mml:mrow></mml:msub><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> v </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> u </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula>;</p>
      <p>2) Replace the original function <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> with the nonincreasing function <inline-formula><mml:math><mml:mrow><mml:mover accent="true"><mml:mi> ℓ </mml:mi><mml:mo> ^ </mml:mo></mml:mover><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mrow><mml:mtext> sup </mml:mtext></mml:mrow><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> ≤ </mml:mo><mml:mi> v </mml:mi><mml:mo> ≤ </mml:mo><mml:mi> u </mml:mi></mml:mrow></mml:msub><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> v </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ≥ </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> u </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula>.</p>
      <p>Next, we elaborate on the intrinsic relationship between the two types of smooth functions. In fact, under appropriate assumptions, <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smooth functions and <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth functions are equivalent.</p>
      <p><bold>Propo</bold><bold>sition 1</bold><bold>.</bold> If <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth, then <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is also <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smooth; if <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smooth and <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is a differentiable closed function on the open effective domain <inline-formula><mml:math><mml:mi> X </mml:mi></mml:math></inline-formula> , then <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> m </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth function, where <inline-formula><mml:math><mml:mrow><mml:mi> m </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> u </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> u </mml:mi><mml:mo> + </mml:mo><mml:mi> a </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> u </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mrow><mml:mi> a </mml:mi><mml:mo> / </mml:mo><mml:mrow><mml:mi> m </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> u </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:mrow></mml:mrow></mml:math></inline-formula> , and the constant <inline-formula><mml:math><mml:mrow><mml:mi> a </mml:mi><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> is arbitrary. </p>
      <p>The proof of the above proposition can be found in appendix A.2 of [<xref ref-type="bibr" rid="B21">21</xref>]. The objective function considered in this paper obviously satisfies the assumptions of Proposition 1. In view of the equivalence between <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smoothness and <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness in the above framework, the subsequent theoretical analysis will mainly focus on <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -generalized smooth functions.</p>
      <p><bold>Lemma 2</bold>(Descent Lemma [<xref ref-type="bibr" rid="B23">23</xref>]). Let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be a <inline-formula><mml:math><mml:mi> M </mml:mi></mml:math></inline-formula> -smooth function, where <inline-formula><mml:math><mml:mi mathvariant="script"> X </mml:mi></mml:math></inline-formula> is a convex set. Then for all <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> , we have</p>
      <disp-formula id="FD6">
        <mml:math>
          <mml:mrow>
            <mml:mi>f</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mi>y</mml:mi>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>≤</mml:mo>
            <mml:mi>f</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mi>x</mml:mi>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>+</mml:mo>
            <mml:mrow>
              <mml:mo>〈</mml:mo>
              <mml:mrow>
                <mml:mo>∇</mml:mo>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
                <mml:mo>,</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>−</mml:mo>
                <mml:mi>x</mml:mi>
              </mml:mrow>
              <mml:mo>〉</mml:mo>
            </mml:mrow>
            <mml:mo>+</mml:mo>
            <mml:mfrac>
              <mml:mi>M</mml:mi>
              <mml:mn>2</mml:mn>
            </mml:mfrac>
            <mml:msup>
              <mml:mrow>
                <mml:mrow>
                  <mml:mo>‖</mml:mo>
                  <mml:mrow>
                    <mml:mi>x</mml:mi>
                    <mml:mo>−</mml:mo>
                    <mml:mi>y</mml:mi>
                  </mml:mrow>
                  <mml:mo>‖</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mn>2</mml:mn>
            </mml:msup>
            <mml:mo>.</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p><bold>Lemma 3</bold><bold>.</bold> [<xref ref-type="bibr" rid="B21">21</xref>] Suppose the differentiable function <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> satisfies <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness, and for all <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> C </mml:mi></mml:mrow></mml:math></inline-formula> , Then</p>
      <p>1) <inline-formula><mml:math><mml:mrow><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ⊆ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> ;</p>
      <p>2) For any <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> x </mml:mi><mml:mn> 1 </mml:mn></mml:msub><mml:mo> , </mml:mo><mml:msub><mml:mi> x </mml:mi><mml:mn> 2 </mml:mn></mml:msub><mml:mo> ∈ </mml:mo><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> ,</p>
      <disp-formula id="FD7">
        <label>(2)</label>
        <mml:math>
          <mml:mrow>
            <mml:mrow>
              <mml:mo>‖</mml:mo>
              <mml:mrow>
                <mml:mo>∇</mml:mo>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mrow>
                    <mml:msub>
                      <mml:mi>x</mml:mi>
                      <mml:mn>1</mml:mn>
                    </mml:msub>
                  </mml:mrow>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
                <mml:mo>−</mml:mo>
                <mml:mo>∇</mml:mo>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mrow>
                    <mml:msub>
                      <mml:mi>x</mml:mi>
                      <mml:mn>2</mml:mn>
                    </mml:msub>
                  </mml:mrow>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>‖</mml:mo>
            </mml:mrow>
            <mml:mo>≤</mml:mo>
            <mml:msub>
              <mml:mi>L</mml:mi>
              <mml:mi>f</mml:mi>
            </mml:msub>
            <mml:mrow>
              <mml:mo>‖</mml:mo>
              <mml:mrow>
                <mml:msub>
                  <mml:mi>x</mml:mi>
                  <mml:mn>1</mml:mn>
                </mml:msub>
                <mml:mo>−</mml:mo>
                <mml:msub>
                  <mml:mi>x</mml:mi>
                  <mml:mn>2</mml:mn>
                </mml:msub>
              </mml:mrow>
              <mml:mo>‖</mml:mo>
            </mml:mrow>
            <mml:mo>,</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <disp-formula id="FD8">
        <label>(3)</label>
        <mml:math>
          <mml:mrow>
            <mml:mi>f</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mrow>
                <mml:msub>
                  <mml:mi>x</mml:mi>
                  <mml:mn>1</mml:mn>
                </mml:msub>
              </mml:mrow>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>≤</mml:mo>
            <mml:mi>f</mml:mi>
            <mml:mrow>
              <mml:mo>(</mml:mo>
              <mml:mrow>
                <mml:msub>
                  <mml:mi>x</mml:mi>
                  <mml:mn>2</mml:mn>
                </mml:msub>
              </mml:mrow>
              <mml:mo>)</mml:mo>
            </mml:mrow>
            <mml:mo>+</mml:mo>
            <mml:mrow>
              <mml:mo>〈</mml:mo>
              <mml:mrow>
                <mml:mo>∇</mml:mo>
                <mml:mi>f</mml:mi>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mrow>
                    <mml:msub>
                      <mml:mi>x</mml:mi>
                      <mml:mn>2</mml:mn>
                    </mml:msub>
                  </mml:mrow>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
                <mml:mo>,</mml:mo>
                <mml:msub>
                  <mml:mi>x</mml:mi>
                  <mml:mn>1</mml:mn>
                </mml:msub>
                <mml:mo>−</mml:mo>
                <mml:msub>
                  <mml:mi>x</mml:mi>
                  <mml:mn>2</mml:mn>
                </mml:msub>
              </mml:mrow>
              <mml:mo>〉</mml:mo>
            </mml:mrow>
            <mml:mo>+</mml:mo>
            <mml:mfrac>
              <mml:mrow>
                <mml:msub>
                  <mml:mi>L</mml:mi>
                  <mml:mi>f</mml:mi>
                </mml:msub>
              </mml:mrow>
              <mml:mn>2</mml:mn>
            </mml:mfrac>
            <mml:msup>
              <mml:mrow>
                <mml:mrow>
                  <mml:mo>‖</mml:mo>
                  <mml:mrow>
                    <mml:msub>
                      <mml:mi>x</mml:mi>
                      <mml:mn>1</mml:mn>
                    </mml:msub>
                    <mml:mo>−</mml:mo>
                    <mml:msub>
                      <mml:mi>x</mml:mi>
                      <mml:mn>2</mml:mn>
                    </mml:msub>
                  </mml:mrow>
                  <mml:mo>‖</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mn>2</mml:mn>
            </mml:msup>
            <mml:mo>,</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>where <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mi> f </mml:mi></mml:msub><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> denotes an effective smoothness constant.</p>
      <p>Proof of the above lemma can be found in appendix A.3 of [<xref ref-type="bibr" rid="B21">21</xref>].</p>
      <p><bold>Remark</bold><bold>.</bold> From Lemma 3, it is not difficult to see that when the gradient norm of an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth function is bounded, it also satisfies the property of a classical smooth function in a local neighborhood <inline-formula><mml:math><mml:mrow><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , <italic>i.e.</italic>, the descent lemma.</p>
      <p><bold>Remark</bold><bold>.</bold> From Proposition 1, the two classes of smooth functions are equivalent. Therefore, the conclusion of Lemma 3 obviously also holds for <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> -smooth functions. When <inline-formula><mml:math><mml:mrow><mml:mi> a </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mi> C </mml:mi></mml:mrow></mml:math></inline-formula> , it suffices to take <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mi> f </mml:mi></mml:msub><mml:mo> = </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 2 </mml:mn><mml:mi> C </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mrow><mml:mi> C </mml:mi><mml:mo> / </mml:mo><mml:mrow><mml:msub><mml:mi> L </mml:mi><mml:mi> f </mml:mi></mml:msub></mml:mrow></mml:mrow></mml:mrow></mml:math></inline-formula> to obtain the corresponding conclusion [<xref ref-type="bibr" rid="B21">21</xref>]. </p>
      <p><bold>Lemma 4</bold>(Nonexpansiveness of the Proximal Operator [<xref ref-type="bibr" rid="B23">23</xref>]). Let <inline-formula><mml:math><mml:mrow><mml:mi> g </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> be a closed proper convex function. Then for any <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> , we have</p>
      <disp-formula id="FD9">
        <label>(4)</label>
        <mml:math>
          <mml:mrow>
            <mml:mrow>
              <mml:mo>〈</mml:mo>
              <mml:mrow>
                <mml:mi>x</mml:mi>
                <mml:mo>−</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>,</mml:mo>
                <mml:msub>
                  <mml:mrow>
                    <mml:mtext>prox</mml:mtext>
                  </mml:mrow>
                  <mml:mi>g</mml:mi>
                </mml:msub>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
                <mml:mo>−</mml:mo>
                <mml:msub>
                  <mml:mrow>
                    <mml:mtext>prox</mml:mtext>
                  </mml:mrow>
                  <mml:mi>g</mml:mi>
                </mml:msub>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>y</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>〉</mml:mo>
            </mml:mrow>
            <mml:mo>≥</mml:mo>
            <mml:msup>
              <mml:mrow>
                <mml:mrow>
                  <mml:mo>‖</mml:mo>
                  <mml:mrow>
                    <mml:msub>
                      <mml:mrow>
                        <mml:mtext>prox</mml:mtext>
                      </mml:mrow>
                      <mml:mi>g</mml:mi>
                    </mml:msub>
                    <mml:mrow>
                      <mml:mo>(</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>)</mml:mo>
                    </mml:mrow>
                    <mml:mo>−</mml:mo>
                    <mml:msub>
                      <mml:mrow>
                        <mml:mtext>prox</mml:mtext>
                      </mml:mrow>
                      <mml:mi>g</mml:mi>
                    </mml:msub>
                    <mml:mrow>
                      <mml:mo>(</mml:mo>
                      <mml:mi>y</mml:mi>
                      <mml:mo>)</mml:mo>
                    </mml:mrow>
                  </mml:mrow>
                  <mml:mo>‖</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mn>2</mml:mn>
            </mml:msup>
            <mml:mo>,</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
      <p>and</p>
      <disp-formula id="FD10">
        <mml:math>
          <mml:mrow>
            <mml:mrow>
              <mml:mo>‖</mml:mo>
              <mml:mrow>
                <mml:msub>
                  <mml:mrow>
                    <mml:mtext>prox</mml:mtext>
                  </mml:mrow>
                  <mml:mi>g</mml:mi>
                </mml:msub>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
                <mml:mo>−</mml:mo>
                <mml:msub>
                  <mml:mrow>
                    <mml:mtext>prox</mml:mtext>
                  </mml:mrow>
                  <mml:mi>g</mml:mi>
                </mml:msub>
                <mml:mrow>
                  <mml:mo>(</mml:mo>
                  <mml:mi>y</mml:mi>
                  <mml:mo>)</mml:mo>
                </mml:mrow>
              </mml:mrow>
              <mml:mo>‖</mml:mo>
            </mml:mrow>
            <mml:mo>≤</mml:mo>
            <mml:mrow>
              <mml:mo>‖</mml:mo>
              <mml:mrow>
                <mml:mi>x</mml:mi>
                <mml:mo>−</mml:mo>
                <mml:mi>y</mml:mi>
              </mml:mrow>
              <mml:mo>‖</mml:mo>
            </mml:mrow>
            <mml:mo>.</mml:mo>
          </mml:mrow>
        </mml:math>
      </disp-formula>
    </sec>
    <sec id="sec3">
      <title>3. The Proximal Gradient Method</title>
      <sec id="sec3dot1">
        <title>3.1. The Proximal Gradient Method</title>
        <p>This paper mainly considers the framework of generalized smoothness assumptions, and investigates the iterative convergence rate of PGD for solving unconstrained composite convex optimization problems. In the following, this chapter will discuss the convex case, present and prove the convergence rate of PGD.</p>
        <p>Before proceeding with the study, we first introduce an important fundamental assumption in the field of optimization algorithm research, namely, the existence of an optimal solution. </p>
        <p><bold>Assumption 1</bold><bold>.</bold> Assume there exists a point <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> * </mml:mo></mml:msup><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> such that <inline-formula><mml:math><mml:mrow><mml:mi> F </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> * </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:msup><mml:mi> F </mml:mi><mml:mo> * </mml:mo></mml:msup><mml:mo> = </mml:mo><mml:msub><mml:mrow><mml:mi> inf </mml:mi></mml:mrow><mml:mrow><mml:mi> x </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:msub><mml:mi> F </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> .</p>
        <p>This chapter mainly considers the constant step-size version of PGD. Let the iteration step size be <inline-formula><mml:math><mml:mrow><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac></mml:mrow></mml:math></inline-formula> , where <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> . The iteration scheme is given by</p>
        <disp-formula id="FD11">
          <label>(5)</label>
          <mml:math>
            <mml:mrow>
              <mml:msup>
                <mml:mi>x</mml:mi>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>+</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:msup>
              <mml:mo>=</mml:mo>
              <mml:msub>
                <mml:mrow>
                  <mml:mtext>prox</mml:mtext>
                </mml:mrow>
                <mml:mrow>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:mi>g</mml:mi>
                </mml:mrow>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                  <mml:mo>−</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>For simplicity, we define <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mrow><mml:mtext> prox </mml:mtext></mml:mrow><mml:mrow><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac><mml:mi> g </mml:mi></mml:mrow></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> − </mml:mo><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Then the PGD iteration scheme is abbreviated as</p>
        <disp-formula id="FD12">
          <mml:math>
            <mml:mrow>
              <mml:msup>
                <mml:mi>x</mml:mi>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>+</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:msup>
              <mml:mo>=</mml:mo>
              <mml:msub>
                <mml:mi>T</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Next, we introduce an important tool, the gradient mapping, which is defined as follows.</p>
        <p><bold>Definition 3</bold><bold>.</bold> When solving the objective problem (1) using PGD (5), combined with the definition of the operator <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub></mml:mrow></mml:math></inline-formula> , the mapping <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> is defined as </p>
        <disp-formula id="FD13">
          <mml:math>
            <mml:mrow>
              <mml:msub>
                <mml:mi>G</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mi>L</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
              <mml:mtext>
                 
              </mml:mtext>
              <mml:mtext>
                 
              </mml:mtext>
              <mml:mi>x</mml:mi>
              <mml:mo>∈</mml:mo>
              <mml:mi mathvariant="script">X</mml:mi>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>and is called the gradient mapping.</p>
        <p>Based on the above definition of the gradient mapping, the proximal gradient iteration can be equivalently transformed into a gradient descent iteration format, <italic>i.e.</italic>,</p>
        <disp-formula id="FD14">
          <mml:math>
            <mml:mrow>
              <mml:msup>
                <mml:mi>x</mml:mi>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>+</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:msup>
              <mml:mo>=</mml:mo>
              <mml:msup>
                <mml:mi>x</mml:mi>
                <mml:mi>t</mml:mi>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:msub>
                <mml:mi>G</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Through this structural reconstruction, it is not difficult to see that PGD can be regarded as a natural extension of the classical gradient descent method in composite optimization problems.</p>
        <p>Since cocoercivity serves as an important theoretical guarantee for the convergence analysis of the PGD iteration framework. However, in the composite convex optimization problem (1) considered in this paper, the function <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is only <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth. Therefore, we need to verify whether the corresponding co-coercivity still holds when the function satisfies <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smoothness. Li <italic>et al.</italic> [<xref ref-type="bibr" rid="B21">21</xref>] pointed out that when a function is both convex and <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth, its gradient also possesses cocoercivity, as stated in the following lemma.</p>
        <p><bold>Lemma 5</bold>(cocoercivity [<xref ref-type="bibr" rid="B21">21</xref>]). Let the function <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth convex function. Then for <inline-formula><mml:math><mml:mrow><mml:mo> ∀ </mml:mo><mml:mi> x </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mfrac><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we have</p>
        <disp-formula id="FD15">
          <label>(6)</label>
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>‖</mml:mo>
                        <mml:mrow>
                          <mml:mo>∇</mml:mo>
                          <mml:mi>f</mml:mi>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>x</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>‖</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Furthermore, we will investigate the convergence rate of PGD iterations based on the concept of co-coercivity. Since we will utilize Lemma 4 in the convergence analysis of PGD, it requires that consecutive iterates <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> k </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup><mml:mo> , </mml:mo><mml:msup><mml:mi> x </mml:mi><mml:mi> k </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> of PGD satisfy <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> k </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup><mml:mo> − </mml:mo><mml:msup><mml:mi> x </mml:mi><mml:mi> k </mml:mi></mml:msup></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mi> k </mml:mi></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mrow><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> / </mml:mo><mml:mn> 2 </mml:mn></mml:mrow></mml:mrow></mml:math></inline-formula> , Based on this, we prove that the norm of the gradient mapping <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mi> k </mml:mi></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is monotonically decreasing.</p>
        <p><bold>Lemma 6</bold><bold>.</bold> Let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth differentiable convex function satisfying <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> C </mml:mi></mml:mrow></mml:math></inline-formula> ; and let <inline-formula><mml:math><mml:mrow><mml:mi> g </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> be a proper closed convex function. If for <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ∈ </mml:mo><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mfrac><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ⊆ </mml:mo><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mfrac><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , then</p>
        <disp-formula id="FD16">
          <label>(7)</label>
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <disp-formula id="FD17">
          <mml:math>
            <mml:mrow>
              <mml:mi>L</mml:mi>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>L</mml:mi>
                    <mml:mi>f</mml:mi>
                  </mml:msub>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:mo>=</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p><italic>Proof.</italic> Let <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:mi> B </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mfrac><mml:mrow><mml:mi> r </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . By Lemma 4, the proximal operator is nonexpansive. When we choose <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mi> x </mml:mi><mml:mo> − </mml:mo><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mi> y </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mi> y </mml:mi><mml:mo> − </mml:mo><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> y </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> respectively, Equation (4) becomes</p>
        <disp-formula id="FD18">
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mi>y</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Since the mapping <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mo> = </mml:mo><mml:mtext> Id </mml:mtext><mml:mo> − </mml:mo><mml:mfrac><mml:mn> 1 </mml:mn><mml:mi> L </mml:mi></mml:mfrac><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub></mml:mrow></mml:math></inline-formula> , the above inequality can be transformed into</p>
        <disp-formula id="FD19">
          <mml:math>
            <mml:mtable columnalign="left">
              <mml:mtr>
                <mml:mtd>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:mi>x</mml:mi>
                          <mml:mo>−</mml:mo>
                          <mml:mfrac>
                            <mml:mn>1</mml:mn>
                            <mml:mi>L</mml:mi>
                          </mml:mfrac>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>x</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:mi>y</mml:mi>
                          <mml:mo>−</mml:mo>
                          <mml:mfrac>
                            <mml:mn>1</mml:mn>
                            <mml:mi>L</mml:mi>
                          </mml:mfrac>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>y</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:mi>x</mml:mi>
                          <mml:mo>−</mml:mo>
                          <mml:mfrac>
                            <mml:mn>1</mml:mn>
                            <mml:mi>L</mml:mi>
                          </mml:mfrac>
                          <mml:mo>∇</mml:mo>
                          <mml:mi>f</mml:mi>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>x</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:mi>y</mml:mi>
                          <mml:mo>−</mml:mo>
                          <mml:mfrac>
                            <mml:mn>1</mml:mn>
                            <mml:mi>L</mml:mi>
                          </mml:mfrac>
                          <mml:mo>∇</mml:mo>
                          <mml:mi>f</mml:mi>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>y</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>≥</mml:mo>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mrow>
                            <mml:mi>x</mml:mi>
                            <mml:mo>−</mml:mo>
                            <mml:mfrac>
                              <mml:mn>1</mml:mn>
                              <mml:mi>L</mml:mi>
                            </mml:mfrac>
                            <mml:msub>
                              <mml:mi>G</mml:mi>
                              <mml:mi>L</mml:mi>
                            </mml:msub>
                            <mml:mrow>
                              <mml:mo>(</mml:mo>
                              <mml:mi>x</mml:mi>
                              <mml:mo>)</mml:mo>
                            </mml:mrow>
                          </mml:mrow>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mrow>
                            <mml:mi>y</mml:mi>
                            <mml:mo>−</mml:mo>
                            <mml:mfrac>
                              <mml:mn>1</mml:mn>
                              <mml:mi>L</mml:mi>
                            </mml:mfrac>
                            <mml:msub>
                              <mml:mi>G</mml:mi>
                              <mml:mi>L</mml:mi>
                            </mml:msub>
                            <mml:mrow>
                              <mml:mo>(</mml:mo>
                              <mml:mi>y</mml:mi>
                              <mml:mo>)</mml:mo>
                            </mml:mrow>
                          </mml:mrow>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                  <mml:mo>.</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>Because <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , the above inequality can be simplified as </p>
        <disp-formula id="FD20">
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mi>y</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mn>0</mml:mn>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Further, by expanding the inner product and rearranging terms, we obtain</p>
        <disp-formula id="FD21">
          <label>(8)</label>
          <mml:math display="inline">
            <mml:mtable>
              <mml:mtr>
                <mml:mtd>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>≥</mml:mo>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>+</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>y</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mo>−</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>.</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>Since the function <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth differentiable convex function and satisfies <inline-formula><mml:math display="inline"><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> C </mml:mi></mml:mrow></mml:math></inline-formula> , it follows from Lemma 5 that</p>
        <disp-formula id="FD22">
          <mml:math>
            <mml:mtable>
              <mml:mtr>
                <mml:mtd>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>≥</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mrow>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:mrow>
                            <mml:mo>‖</mml:mo>
                            <mml:mrow>
                              <mml:mo>∇</mml:mo>
                              <mml:mi>f</mml:mi>
                              <mml:mrow>
                                <mml:mo>(</mml:mo>
                                <mml:mi>x</mml:mi>
                                <mml:mo>)</mml:mo>
                              </mml:mrow>
                            </mml:mrow>
                            <mml:mo>‖</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:mo>∇</mml:mo>
                        <mml:mi>f</mml:mi>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:mo>∇</mml:mo>
                        <mml:mi>f</mml:mi>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>y</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>≥</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mrow>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:mo>∇</mml:mo>
                        <mml:mi>f</mml:mi>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:mo>∇</mml:mo>
                        <mml:mi>f</mml:mi>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>y</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                  <mml:mo>,</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>where the second inequality holds because <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> C </mml:mi></mml:mrow></mml:math></inline-formula> and the function <inline-formula><mml:math><mml:mi> ℓ </mml:mi></mml:math></inline-formula> is nondecreasing and continuous. Therefore, based on the above inequality, Equation (8) can be further transformed into </p>
        <disp-formula id="FD23">
          <label>(9)</label>
          <mml:math>
            <mml:mtable columnalign="left">
              <mml:mtr>
                <mml:mtd>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>≥</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>y</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                  <mml:mo>+</mml:mo>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:mo>∇</mml:mo>
                        <mml:mi>f</mml:mi>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:mo>∇</mml:mo>
                        <mml:mi>f</mml:mi>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>y</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mo>−</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>For convenience, let <inline-formula><mml:math><mml:mrow><mml:mi> a </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> − </mml:mo><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> y </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , <inline-formula><mml:math><mml:mrow><mml:mi> b </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> − </mml:mo><mml:mo> ∇ </mml:mo><mml:mi> f </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> y </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Then the right-hand side of the above inequality can be further simplified as</p>
        <disp-formula id="FD24">
          <mml:math>
            <mml:mrow>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mi>a</mml:mi>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>+</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mi>b</mml:mi>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:msup>
                <mml:mi>a</mml:mi>
                <mml:mtext>T</mml:mtext>
              </mml:msup>
              <mml:mi>b</mml:mi>
              <mml:mo>=</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>⋅</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mi>a</mml:mi>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>+</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mfrac>
                        <mml:mrow>
                          <mml:mi>ℓ</mml:mi>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>C</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mrow>
                          <mml:mn>2</mml:mn>
                          <mml:mi>L</mml:mi>
                        </mml:mrow>
                      </mml:mfrac>
                      <mml:mi>a</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>b</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Substituting the simplified result back into (9) yields</p>
        <disp-formula id="FD25">
          <mml:math>
            <mml:mrow>
              <mml:mi>ℓ</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>C</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>⋅</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Since the function <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we have <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> always holds. Dividing both sides of the above inequality by <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we obtain</p>
        <disp-formula id="FD26">
          <label>(10)</label>
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Next, we estimate the left-hand side of (10). Using the Cauchy-Schwarz inequality, we obtain</p>
        <disp-formula id="FD27">
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Therefore, combining the above inequality with (10) yields </p>
        <disp-formula id="FD28">
          <label>(11)</label>
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>According to the definition of the gradient mapping <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mi> L </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> − </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , and taking <inline-formula><mml:math><mml:mrow><mml:mi> y </mml:mi><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we obtain </p>
        <disp-formula id="FD29">
          <mml:math>
            <mml:mrow>
              <mml:mi>x</mml:mi>
              <mml:mo>−</mml:mo>
              <mml:mi>y</mml:mi>
              <mml:mo>=</mml:mo>
              <mml:mi>x</mml:mi>
              <mml:mo>−</mml:mo>
              <mml:msub>
                <mml:mi>T</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:msub>
                <mml:mi>G</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>and</p>
        <disp-formula id="FD30">
          <mml:math>
            <mml:mrow>
              <mml:msub>
                <mml:mi>G</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mi>L</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>y</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:msub>
                <mml:mi>G</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mi>L</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Let <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , the last equality is abbreviated as <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> y </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mi> L </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup><mml:mo> − </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Substituting these two equalities into (10), we obtain</p>
        <disp-formula id="FD31">
          <label>(12)</label>
          <mml:math>
            <mml:mtable columnalign="left">
              <mml:mtr>
                <mml:mtd>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:mo>−</mml:mo>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>≥</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mrow>
                            <mml:msup>
                              <mml:mi>x</mml:mi>
                              <mml:mo>+</mml:mo>
                            </mml:msup>
                          </mml:mrow>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>⇔</mml:mo>
                  <mml:mo>−</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>〈</mml:mo>
                        <mml:mrow>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mrow>
                              <mml:msup>
                                <mml:mi>x</mml:mi>
                                <mml:mo>+</mml:mo>
                              </mml:msup>
                            </mml:mrow>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                          <mml:mo>,</mml:mo>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>x</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>〉</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mrow>
                          <mml:mrow>
                            <mml:mo>‖</mml:mo>
                            <mml:mrow>
                              <mml:msub>
                                <mml:mi>G</mml:mi>
                                <mml:mi>L</mml:mi>
                              </mml:msub>
                              <mml:mrow>
                                <mml:mo>(</mml:mo>
                                <mml:mi>x</mml:mi>
                                <mml:mo>)</mml:mo>
                              </mml:mrow>
                            </mml:mrow>
                            <mml:mo>‖</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mtext>
                     
                  </mml:mtext>
                  <mml:mo>≥</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mrow>
                          <mml:mrow>
                            <mml:mo>‖</mml:mo>
                            <mml:mrow>
                              <mml:msub>
                                <mml:mi>G</mml:mi>
                                <mml:mi>L</mml:mi>
                              </mml:msub>
                              <mml:mrow>
                                <mml:mo>(</mml:mo>
                                <mml:mrow>
                                  <mml:msup>
                                    <mml:mi>x</mml:mi>
                                    <mml:mo>+</mml:mo>
                                  </mml:msup>
                                </mml:mrow>
                                <mml:mo>)</mml:mo>
                              </mml:mrow>
                            </mml:mrow>
                            <mml:mo>‖</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:mn>2</mml:mn>
                      <mml:mrow>
                        <mml:mo>〈</mml:mo>
                        <mml:mrow>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mrow>
                              <mml:msup>
                                <mml:mi>x</mml:mi>
                                <mml:mo>+</mml:mo>
                              </mml:msup>
                            </mml:mrow>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                          <mml:mo>,</mml:mo>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mi>x</mml:mi>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>〉</mml:mo>
                      </mml:mrow>
                      <mml:mo>+</mml:mo>
                      <mml:msup>
                        <mml:mrow>
                          <mml:mrow>
                            <mml:mo>‖</mml:mo>
                            <mml:mrow>
                              <mml:msub>
                                <mml:mi>G</mml:mi>
                                <mml:mi>L</mml:mi>
                              </mml:msub>
                              <mml:mrow>
                                <mml:mo>(</mml:mo>
                                <mml:mi>x</mml:mi>
                                <mml:mo>)</mml:mo>
                              </mml:mrow>
                            </mml:mrow>
                            <mml:mo>‖</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>⇔</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>2</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>2</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>≥</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mrow>
                            <mml:msup>
                              <mml:mi>x</mml:mi>
                              <mml:mo>+</mml:mo>
                            </mml:msup>
                          </mml:mrow>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                  <mml:mo>−</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:msub>
                          <mml:mi>G</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>x</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                  <mml:mo>.</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>1) If <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> = </mml:mo><mml:mfrac><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow></mml:math></inline-formula> , Equation (12) can be simplified as</p>
        <disp-formula id="FD32">
          <mml:math>
            <mml:mrow>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Multiplying both sides by <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , we obtain </p>
        <disp-formula id="FD33">
          <mml:math>
            <mml:mrow>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>≥</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Further, by letting <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we arrive at the final conclusion <inline-formula><mml:math><mml:mrow><mml:msup><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:msup><mml:mo> ≥ </mml:mo><mml:msup><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:msup></mml:mrow></mml:math></inline-formula> .</p>
        <p>2) Similarly, when <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> ∈ </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mfrac><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , combining with Equation (12) and using the Cauchy-Schwarz inequality, we obtain</p>
        <disp-formula id="FD34">
          <label>(13)</label>
          <mml:math>
            <mml:mrow>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>2</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>2</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mo>+</mml:mo>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>By rearranging terms and factoring, the above inequality becomes</p>
        <disp-formula id="FD35">
          <label>(14)</label>
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                  <mml:mo>+</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mn>0.</mml:mn>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>(i) If <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , by the non-negativity of the norm we have <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≥ </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> . Furthermore, since <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , it follows that <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≥ </mml:mo><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , the conclusion holds.</p>
        <p>(ii) If <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≠ </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , by the non-negativity of the norm we have <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> . In this case, <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> must also hold. If <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> were not true, then by the non-negativity of the norm we would have <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> . From (11), with <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mi> L </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> − </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we obtain </p>
        <disp-formula id="FD36">
          <mml:math>
            <mml:mtable>
              <mml:mtr>
                <mml:mtd>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mo>+</mml:mo>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                  <mml:mo>≤</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mo>+</mml:mo>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:mi>x</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                  <mml:mo>=</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mi>x</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>=</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:msup>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mn>4</mml:mn>
                      <mml:mi>L</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>ℓ</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                  </mml:mfrac>
                  <mml:mo>⋅</mml:mo>
                  <mml:mfrac>
                    <mml:mn>1</mml:mn>
                    <mml:mi>L</mml:mi>
                  </mml:mfrac>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>Since <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , it follows that <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , which contradicts the premise <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> . Therefore, given <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> &gt; </mml:mo><mml:mfrac><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , we have <inline-formula><mml:math><mml:mrow><mml:mn> 4 </mml:mn><mml:mi> L </mml:mi><mml:mo> − </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , and consequently</p>
        <disp-formula id="FD37">
          <mml:math>
            <mml:mrow>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:mi>L</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>4</mml:mn>
                  <mml:msup>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mo>+</mml:mo>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>&gt;</mml:mo>
              <mml:mn>0.</mml:mn>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>At this point, combining the above inequality with (14), it is easy to see that <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow><mml:mo> ≥ </mml:mo><mml:mrow><mml:mo> ‖ </mml:mo><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mo> + </mml:mo></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ‖ </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , so the conclusion holds.</p>
        <p>□</p>
        <p>Next, we present the key descent inequality in the convergence analysis.</p>
        <p><bold>Lemma 7</bold> (Basic Proximal Gradient Inequality). Let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be a differentiable convex function, where <inline-formula><mml:math><mml:mi mathvariant="script"> X </mml:mi></mml:math></inline-formula> is an open set, and let <inline-formula><mml:math><mml:mrow><mml:mi> g </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> be a proper closed convex function. For any <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , if</p>
        <disp-formula id="FD38">
          <label>(15)</label>
          <mml:math>
            <mml:mrow>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>then</p>
        <disp-formula id="FD39">
          <label>(16)</label>
          <mml:math>
            <mml:mrow>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>+</mml:mo>
              <mml:mi>h</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>x</mml:mi>
                  <mml:mo>,</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <disp-formula id="FD40">
          <mml:math>
            <mml:mrow>
              <mml:mi>h</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>x</mml:mi>
                  <mml:mo>,</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p><italic>Proof.</italic> Define the function </p>
        <disp-formula id="FD41">
          <label>(17)</label>
          <mml:math>
            <mml:mrow>
              <mml:mi>ϕ</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>u</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>:</mml:mo>
              <mml:mo>=</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>u</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mi>g</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>u</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>u</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Clearly, <inline-formula><mml:math><mml:mi> ϕ </mml:mi></mml:math></inline-formula> is a strongly convex function with strong convexity modulus <inline-formula><mml:math><mml:mi> L </mml:mi></mml:math></inline-formula> . From the definition of <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we have </p>
        <disp-formula id="FD42">
          <label>(18)</label>
          <mml:math>
            <mml:mtable>
              <mml:mtr>
                <mml:mtd>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>=</mml:mo>
                  <mml:msub>
                    <mml:mtext>prox</mml:mtext>
                    <mml:mrow>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:mi>g</mml:mi>
                    </mml:mrow>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mi>y</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mfrac>
                        <mml:mn>1</mml:mn>
                        <mml:mi>L</mml:mi>
                      </mml:mfrac>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>=</mml:mo>
                  <mml:mtext>arg</mml:mtext>
                  <mml:munder>
                    <mml:mrow>
                      <mml:mtext>min</mml:mtext>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mi>u</mml:mi>
                      <mml:mo>∈</mml:mo>
                      <mml:msup>
                        <mml:mi>ℝ</mml:mi>
                        <mml:mi>d</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                  </mml:munder>
                  <mml:mrow>
                    <mml:mo>{</mml:mo>
                    <mml:mrow>
                      <mml:mi>g</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>u</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>+</mml:mo>
                      <mml:mfrac>
                        <mml:mi>L</mml:mi>
                        <mml:mn>2</mml:mn>
                      </mml:mfrac>
                      <mml:msup>
                        <mml:mrow>
                          <mml:mrow>
                            <mml:mo>‖</mml:mo>
                            <mml:mrow>
                              <mml:mi>u</mml:mi>
                              <mml:mo>−</mml:mo>
                              <mml:mrow>
                                <mml:mo>(</mml:mo>
                                <mml:mrow>
                                  <mml:mi>y</mml:mi>
                                  <mml:mo>−</mml:mo>
                                  <mml:mfrac>
                                    <mml:mn>1</mml:mn>
                                    <mml:mi>L</mml:mi>
                                  </mml:mfrac>
                                  <mml:mo>∇</mml:mo>
                                  <mml:mi>f</mml:mi>
                                  <mml:mrow>
                                    <mml:mo>(</mml:mo>
                                    <mml:mi>y</mml:mi>
                                    <mml:mo>)</mml:mo>
                                  </mml:mrow>
                                </mml:mrow>
                                <mml:mo>)</mml:mo>
                              </mml:mrow>
                            </mml:mrow>
                            <mml:mo>‖</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mn>2</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>}</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>=</mml:mo>
                  <mml:mtext>arg</mml:mtext>
                  <mml:munder>
                    <mml:mrow>
                      <mml:mtext>min</mml:mtext>
                    </mml:mrow>
                    <mml:mrow>
                      <mml:mi>u</mml:mi>
                      <mml:mo>∈</mml:mo>
                      <mml:msup>
                        <mml:mi>ℝ</mml:mi>
                        <mml:mi>d</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                  </mml:munder>
                  <mml:mi>ϕ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>u</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>.</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>By strong convexity, we obtain</p>
        <disp-formula id="FD43">
          <label>(19)</label>
          <mml:math>
            <mml:mrow>
              <mml:mi>ϕ</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>ϕ</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Using the convexity of <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> , we have</p>
        <disp-formula id="FD44">
          <mml:math>
            <mml:mrow>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>y</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Letting <inline-formula><mml:math><mml:mrow><mml:mi> u </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> y </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> and substituting it into (17), together with the above inequality, we get </p>
        <disp-formula id="FD45">
          <mml:math>
            <mml:mtable>
              <mml:mtr>
                <mml:mtd>
                  <mml:mi>ϕ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>=</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>+</mml:mo>
                  <mml:mrow>
                    <mml:mo>〈</mml:mo>
                    <mml:mrow>
                      <mml:mo>∇</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>,</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>〉</mml:mo>
                  </mml:mrow>
                  <mml:mo>+</mml:mo>
                  <mml:mfrac>
                    <mml:mi>L</mml:mi>
                    <mml:mn>2</mml:mn>
                  </mml:mfrac>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mo>‖</mml:mo>
                      <mml:mrow>
                        <mml:msub>
                          <mml:mi>T</mml:mi>
                          <mml:mi>L</mml:mi>
                        </mml:msub>
                        <mml:mrow>
                          <mml:mo>(</mml:mo>
                          <mml:mi>y</mml:mi>
                          <mml:mo>)</mml:mo>
                        </mml:mrow>
                        <mml:mo>−</mml:mo>
                        <mml:mi>y</mml:mi>
                      </mml:mrow>
                      <mml:mo>‖</mml:mo>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                  <mml:mo>+</mml:mo>
                  <mml:mi>g</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mtd>
              </mml:mtr>
              <mml:mtr>
                <mml:mtd>
                  <mml:mo>≥</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>+</mml:mo>
                  <mml:mi>g</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>=</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                </mml:mtd>
              </mml:mtr>
            </mml:mtable>
          </mml:math>
        </disp-formula>
        <p>furthermore, from (19), it is not difficult to see that </p>
        <disp-formula id="FD46">
          <mml:math>
            <mml:mrow>
              <mml:mi>ϕ</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Next, substituting <inline-formula><mml:math><mml:mrow><mml:mi> u </mml:mi><mml:mo> : </mml:mo><mml:mo> = </mml:mo><mml:mi> x </mml:mi></mml:mrow></mml:math></inline-formula> into the expression for <inline-formula><mml:math><mml:mrow><mml:mi> ϕ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> u </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> and combining with the above inequality, we obtain</p>
        <disp-formula id="FD47">
          <mml:math>
            <mml:mrow>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mi>g</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>by rearranging terms, we get</p>
        <disp-formula id="FD48">
          <mml:math>
            <mml:mrow>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>y</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>x</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>y</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>+</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>y</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mi>x</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mi>y</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>This completes the proof. □</p>
        <p>Since <inline-formula><mml:math><mml:mi> y </mml:mi></mml:math></inline-formula> is arbitrary, we may replace <inline-formula><mml:math><mml:mi> y </mml:mi></mml:math></inline-formula> with <inline-formula><mml:math><mml:mi> x </mml:mi></mml:math></inline-formula> , and thus the following corollary can be deduced from Lemma 7.</p>
        <p><bold>Corollary 1</bold><bold>.</bold> Let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be a continuously differentiable convex function, where <inline-formula><mml:math><mml:mi mathvariant="script"> X </mml:mi></mml:math></inline-formula> is an open set, and let <inline-formula><mml:math><mml:mrow><mml:mi> g </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> be a proper closed convex function. For any <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> &gt; </mml:mo><mml:mn> 0 </mml:mn></mml:mrow></mml:math></inline-formula> , if</p>
        <disp-formula id="FD49">
          <mml:math>
            <mml:mrow>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>x</mml:mi>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mi>L</mml:mi>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>T</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mi>x</mml:mi>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>then</p>
        <disp-formula id="FD50">
          <mml:math>
            <mml:mrow>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mi>x</mml:mi>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mrow>
                  <mml:mn>2</mml:mn>
                  <mml:mi>L</mml:mi>
                </mml:mrow>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msub>
                        <mml:mi>G</mml:mi>
                        <mml:mi>L</mml:mi>
                      </mml:msub>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Since the consecutive iterates <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> t </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup></mml:mrow></mml:math></inline-formula> and <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mi> t </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> of the proximal gradient method satisfy <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> t </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mi> t </mml:mi></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , Corollary 1 directly establishes the sufficient descent property of the PGD algorithm. In what follows, we combine the above lemmas to study the convergence rate of PGD for solving convex problems.</p>
      </sec>
      <sec id="sec3dot2">
        <title>3.2. Convergence Rate Analysis of the Proximal Gradient Method in the Convex Case</title>
        <p>In this subsection, we consider the case where <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> in the objective function is convex, and analyze the convergence of PGD iterations under the generalized smoothness assumption. Specifically, the convergence rate results obtained through theoretical analysis are as follows.</p>
        <p><bold>Theorem 8</bold><bold>.</bold> Consider problem (1). Let <inline-formula><mml:math><mml:mrow><mml:mi> g </mml:mi><mml:mo> : </mml:mo><mml:msup><mml:mi> ℝ </mml:mi><mml:mi> d </mml:mi></mml:msup><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi><mml:mo> ∪ </mml:mo><mml:mrow><mml:mo> { </mml:mo><mml:mrow><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> } </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> be a proper closed convex function, and let <inline-formula><mml:math><mml:mrow><mml:mi> f </mml:mi><mml:mo> : </mml:mo><mml:mi mathvariant="script"> X </mml:mi><mml:mo> → </mml:mo><mml:mi> ℝ </mml:mi></mml:mrow></mml:math></inline-formula> be a differentiable proper closed convex function, where <inline-formula><mml:math><mml:mi mathvariant="script"> X </mml:mi></mml:math></inline-formula> is an open convex set and <inline-formula><mml:math><mml:mrow><mml:mtext> dom </mml:mtext><mml:mtext>   </mml:mtext><mml:mi> g </mml:mi><mml:mo> ⊆ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> . Assume that <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is an <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth function, where <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is a nondecreasing continuous function and <inline-formula><mml:math><mml:mrow><mml:mi> r </mml:mi><mml:mo> : </mml:mo><mml:mrow><mml:mo> [ </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> → </mml:mo><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mo> + </mml:mo><mml:mi> ∞ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> is a nonincreasing continuous function. Moreover, suppose that <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is <inline-formula><mml:math><mml:mi> C </mml:mi></mml:math></inline-formula> -Lipschitz continuous. If the parameter <inline-formula><mml:math><mml:mi> L </mml:mi></mml:math></inline-formula> satisfies</p>
        <disp-formula id="FD51">
          <mml:math>
            <mml:mrow>
              <mml:mi>L</mml:mi>
              <mml:mo>≥</mml:mo>
              <mml:mtext>max</mml:mtext>
              <mml:mrow>
                <mml:mo>{</mml:mo>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:mrow>
                    <mml:mrow>
                      <mml:mn>2</mml:mn>
                      <mml:mrow>
                        <mml:mo>‖</mml:mo>
                        <mml:mrow>
                          <mml:msub>
                            <mml:mi>G</mml:mi>
                            <mml:mi>L</mml:mi>
                          </mml:msub>
                          <mml:mrow>
                            <mml:mo>(</mml:mo>
                            <mml:mrow>
                              <mml:msub>
                                <mml:mi>x</mml:mi>
                                <mml:mn>0</mml:mn>
                              </mml:msub>
                            </mml:mrow>
                            <mml:mo>)</mml:mo>
                          </mml:mrow>
                        </mml:mrow>
                        <mml:mo>‖</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>/</mml:mo>
                    <mml:mrow>
                      <mml:mi>r</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>}</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>then</p>
        <disp-formula id="FD52">
          <mml:math>
            <mml:mrow>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>k</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:msup>
                <mml:mi>F</mml:mi>
                <mml:mtext>*</mml:mtext>
              </mml:msup>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>L</mml:mi>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>‖</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mn>0</mml:mn>
                          </mml:msup>
                          <mml:mo>−</mml:mo>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mtext>*</mml:mtext>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>‖</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>2</mml:mn>
                  <mml:mi>k</mml:mi>
                </mml:mrow>
              </mml:mfrac>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p><italic>Proof.</italic> Since <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is <inline-formula><mml:math><mml:mi> C </mml:mi></mml:math></inline-formula> -Lipschitz continuous, for any <inline-formula><mml:math><mml:mrow><mml:mi> x </mml:mi><mml:mo> , </mml:mo><mml:mi> y </mml:mi><mml:mo> ∈ </mml:mo><mml:mi mathvariant="script"> X </mml:mi></mml:mrow></mml:math></inline-formula> , we have </p>
        <disp-formula id="FD53">
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>x</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:munder>
                <mml:mrow>
                  <mml:mtext>lim</mml:mtext>
                </mml:mrow>
                <mml:mrow>
                  <mml:mi>y</mml:mi>
                  <mml:mo>→</mml:mo>
                  <mml:mi>x</mml:mi>
                </mml:mrow>
              </mml:munder>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>y</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mi>f</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>x</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>|</mml:mo>
                    <mml:mrow>
                      <mml:mi>y</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>x</mml:mi>
                    </mml:mrow>
                    <mml:mo>|</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>C</mml:mi>
                  <mml:mrow>
                    <mml:mo>|</mml:mo>
                    <mml:mrow>
                      <mml:mi>y</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>x</mml:mi>
                    </mml:mrow>
                    <mml:mo>|</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>|</mml:mo>
                    <mml:mrow>
                      <mml:mi>y</mml:mi>
                      <mml:mo>−</mml:mo>
                      <mml:mi>x</mml:mi>
                    </mml:mrow>
                    <mml:mo>|</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:mo>=</mml:mo>
              <mml:mi>C</mml:mi>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Given that <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> is convex and <inline-formula><mml:math><mml:mrow><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> r </mml:mi><mml:mo> , </mml:mo><mml:mi> ℓ </mml:mi></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> -smooth, and <inline-formula><mml:math><mml:mi> g </mml:mi></mml:math></inline-formula> is a proper closed convex function. First, from</p>
        <disp-formula id="FD54">
          <mml:math>
            <mml:mrow>
              <mml:msup>
                <mml:mi>x</mml:mi>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>+</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:msup>
              <mml:mo>=</mml:mo>
              <mml:msub>
                <mml:mi>T</mml:mi>
                <mml:mi>L</mml:mi>
              </mml:msub>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>and <inline-formula><mml:math><mml:mrow><mml:msub><mml:mi> G </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow><mml:mo> = </mml:mo><mml:mi> L </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mi> x </mml:mi><mml:mo> − </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mi> x </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , together with Lemma 6, we obtain</p>
        <disp-formula id="FD55">
          <mml:math>
            <mml:mrow>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mrow>
                      <mml:mi>t</mml:mi>
                      <mml:mo>+</mml:mo>
                      <mml:mn>1</mml:mn>
                    </mml:mrow>
                  </mml:msup>
                  <mml:mo>−</mml:mo>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>T</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>=</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mrow>
                          <mml:mi>t</mml:mi>
                          <mml:mo>−</mml:mo>
                          <mml:mn>1</mml:mn>
                        </mml:mrow>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mo>⋯</mml:mo>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mn>1</mml:mn>
                <mml:mi>L</mml:mi>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>‖</mml:mo>
                <mml:mrow>
                  <mml:msub>
                    <mml:mi>G</mml:mi>
                    <mml:mi>L</mml:mi>
                  </mml:msub>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>‖</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>r</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>which implies</p>
        <disp-formula id="FD56">
          <mml:math>
            <mml:mrow>
              <mml:msup>
                <mml:mi>x</mml:mi>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>+</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:msup>
              <mml:mo>∈</mml:mo>
              <mml:mi>B</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                  <mml:mo>,</mml:mo>
                  <mml:mfrac>
                    <mml:mrow>
                      <mml:mi>r</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mi>C</mml:mi>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:mfrac>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Secondly, by Lemma 3, the two consecutive iterates <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> t </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup><mml:mo> , </mml:mo><mml:msup><mml:mi> x </mml:mi><mml:mi> t </mml:mi></mml:msup></mml:mrow></mml:math></inline-formula> of PGD always satisfy</p>
        <disp-formula id="FD57">
          <label>(20)</label>
          <mml:math>
            <mml:mrow>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mrow>
                      <mml:mi>t</mml:mi>
                      <mml:mo>+</mml:mo>
                      <mml:mn>1</mml:mn>
                    </mml:mrow>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mi>f</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mrow>
                <mml:mo>〈</mml:mo>
                <mml:mrow>
                  <mml:mo>∇</mml:mo>
                  <mml:mi>f</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>,</mml:mo>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mrow>
                      <mml:mi>t</mml:mi>
                      <mml:mo>+</mml:mo>
                      <mml:mn>1</mml:mn>
                    </mml:mrow>
                  </mml:msup>
                  <mml:mo>−</mml:mo>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>〉</mml:mo>
              </mml:mrow>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mrow>
                          <mml:mi>t</mml:mi>
                          <mml:mo>+</mml:mo>
                          <mml:mn>1</mml:mn>
                        </mml:mrow>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Finally, in Lemma 7, due to the arbitrariness of <inline-formula><mml:math><mml:mi> L </mml:mi></mml:math></inline-formula> , we may set <inline-formula><mml:math><mml:mrow><mml:mi> L </mml:mi><mml:mo> = </mml:mo><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Together with <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> t </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup><mml:mo> = </mml:mo><mml:msub><mml:mi> T </mml:mi><mml:mi> L </mml:mi></mml:msub><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mi> t </mml:mi></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> , we have for any <inline-formula><mml:math><mml:mrow><mml:mi> t </mml:mi><mml:mo> ∈ </mml:mo><mml:msup><mml:mi> ℕ </mml:mi><mml:mtext> * </mml:mtext></mml:msup></mml:mrow></mml:math></inline-formula> ,</p>
        <disp-formula id="FD58">
          <label>(21)</label>
          <mml:math>
            <mml:mrow>
              <mml:mfrac>
                <mml:mn>2</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mrow>
                          <mml:mi>t</mml:mi>
                          <mml:mo>+</mml:mo>
                          <mml:mn>1</mml:mn>
                        </mml:mrow>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mrow>
                          <mml:mi>t</mml:mi>
                          <mml:mo>+</mml:mo>
                          <mml:mn>1</mml:mn>
                        </mml:mrow>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>+</mml:mo>
              <mml:mfrac>
                <mml:mn>2</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:mi>h</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mtext>*</mml:mtext>
                  </mml:msup>
                  <mml:mo>,</mml:mo>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>t</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>where, by Assumption 1, <inline-formula><mml:math><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mtext> * </mml:mtext></mml:msup></mml:mrow></mml:math></inline-formula> is the optimal solution of the objective function, and the second inequality follows from the convexity of <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> . Now, letting <inline-formula><mml:math><mml:mi> t </mml:mi></mml:math></inline-formula> run over <inline-formula><mml:math><mml:mrow><mml:mn> 0 </mml:mn><mml:mo> , </mml:mo><mml:mn> 1 </mml:mn><mml:mo> , </mml:mo><mml:mn> 2 </mml:mn><mml:mo> , </mml:mo><mml:mo> ⋯ </mml:mo><mml:mo> , </mml:mo><mml:mi> k </mml:mi><mml:mo> − </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:math></inline-formula> and summing the inequalities, we obtain</p>
        <disp-formula id="FD59">
          <mml:math>
            <mml:mrow>
              <mml:mfrac>
                <mml:mn>2</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:munderover>
                <mml:mstyle mathsize="140%" displaystyle="true">
                  <mml:mo>∑</mml:mo>
                </mml:mstyle>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>=</mml:mo>
                  <mml:mn>0</mml:mn>
                </mml:mrow>
                <mml:mrow>
                  <mml:mi>k</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:munderover>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mrow>
                          <mml:mi>t</mml:mi>
                          <mml:mo>+</mml:mo>
                          <mml:mn>1</mml:mn>
                        </mml:mrow>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≥</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Multiplying both sides of the above inequality by <inline-formula><mml:math><mml:mrow><mml:mfrac><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow></mml:math></inline-formula> , we get</p>
        <disp-formula id="FD60">
          <mml:math display="inline">
            <mml:mrow>
              <mml:munderover>
                <mml:mstyle mathsize="140%" displaystyle="true">
                  <mml:mo>∑</mml:mo>
                </mml:mstyle>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>=</mml:mo>
                  <mml:mn>0</mml:mn>
                </mml:mrow>
                <mml:mrow>
                  <mml:mi>k</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:munderover>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>k</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>From Corollary 1, we also have <inline-formula><mml:math><mml:mrow><mml:mi> F </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> t </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> F </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mtext> * </mml:mtext></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Combining this with the above inequality yields</p>
        <disp-formula id="FD61">
          <mml:math display="inline">
            <mml:mrow>
              <mml:mfrac>
                <mml:mn>2</mml:mn>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
              </mml:mfrac>
              <mml:munderover>
                <mml:mstyle mathsize="140%" displaystyle="true">
                  <mml:mo>∑</mml:mo>
                </mml:mstyle>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>=</mml:mo>
                  <mml:mn>0</mml:mn>
                </mml:mrow>
                <mml:mrow>
                  <mml:mi>k</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:munderover>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:mi>F</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mtext>*</mml:mtext>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                      <mml:mo>−</mml:mo>
                      <mml:mi>F</mml:mi>
                      <mml:mrow>
                        <mml:mo>(</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mrow>
                              <mml:mi>t</mml:mi>
                              <mml:mo>+</mml:mo>
                              <mml:mn>1</mml:mn>
                            </mml:mrow>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>)</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>≥</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>k</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>Multiplying both sides of the above inequality by <inline-formula><mml:math><mml:mrow><mml:mfrac><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mi> C </mml:mi><mml:mo> ) </mml:mo></mml:mrow></mml:mrow><mml:mn> 2 </mml:mn></mml:mfrac></mml:mrow></mml:math></inline-formula> , we obtain </p>
        <disp-formula id="FD62">
          <mml:math display="inline">
            <mml:mrow>
              <mml:munderover>
                <mml:mstyle mathsize="140%" displaystyle="true">
                  <mml:mo>∑</mml:mo>
                </mml:mstyle>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>=</mml:mo>
                  <mml:mn>0</mml:mn>
                </mml:mrow>
                <mml:mrow>
                  <mml:mi>k</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:munderover>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>t</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>−</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>k</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>From Corollary 1, we also have <inline-formula><mml:math><mml:mrow><mml:mi> F </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mrow><mml:mi> t </mml:mi><mml:mo> + </mml:mo><mml:mn> 1 </mml:mn></mml:mrow></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow><mml:mo> ≤ </mml:mo><mml:mi> F </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:msup><mml:mi> x </mml:mi><mml:mi> t </mml:mi></mml:msup></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> . Combining this with the above inequality yields</p>
        <disp-formula id="FD63">
          <mml:math>
            <mml:mrow>
              <mml:mi>k</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mi>k</mml:mi>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:munderover>
                <mml:mstyle mathsize="140%" displaystyle="true">
                  <mml:mo>∑</mml:mo>
                </mml:mstyle>
                <mml:mrow>
                  <mml:mi>t</mml:mi>
                  <mml:mo>=</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
                <mml:mrow>
                  <mml:mi>k</mml:mi>
                  <mml:mo>−</mml:mo>
                  <mml:mn>1</mml:mn>
                </mml:mrow>
              </mml:munderover>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mrow>
                          <mml:mi>t</mml:mi>
                          <mml:mo>+</mml:mo>
                          <mml:mn>1</mml:mn>
                        </mml:mrow>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:mo>−</mml:mo>
                  <mml:mi>F</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:mfrac>
              <mml:msup>
                <mml:mrow>
                  <mml:mrow>
                    <mml:mo>‖</mml:mo>
                    <mml:mrow>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mtext>*</mml:mtext>
                      </mml:msup>
                      <mml:mo>−</mml:mo>
                      <mml:msup>
                        <mml:mi>x</mml:mi>
                        <mml:mn>0</mml:mn>
                      </mml:msup>
                    </mml:mrow>
                    <mml:mo>‖</mml:mo>
                  </mml:mrow>
                </mml:mrow>
                <mml:mn>2</mml:mn>
              </mml:msup>
              <mml:mo>,</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>which can be rearranged as</p>
        <disp-formula id="FD64">
          <mml:math>
            <mml:mrow>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mi>k</mml:mi>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>−</mml:mo>
              <mml:mi>F</mml:mi>
              <mml:mrow>
                <mml:mo>(</mml:mo>
                <mml:mrow>
                  <mml:msup>
                    <mml:mi>x</mml:mi>
                    <mml:mtext>*</mml:mtext>
                  </mml:msup>
                </mml:mrow>
                <mml:mo>)</mml:mo>
              </mml:mrow>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>ℓ</mml:mi>
                  <mml:mrow>
                    <mml:mo>(</mml:mo>
                    <mml:mi>C</mml:mi>
                    <mml:mo>)</mml:mo>
                  </mml:mrow>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>‖</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mtext>*</mml:mtext>
                          </mml:msup>
                          <mml:mo>−</mml:mo>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mn>0</mml:mn>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>‖</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>2</mml:mn>
                  <mml:mi>k</mml:mi>
                </mml:mrow>
              </mml:mfrac>
              <mml:mo>≤</mml:mo>
              <mml:mfrac>
                <mml:mrow>
                  <mml:mi>L</mml:mi>
                  <mml:msup>
                    <mml:mrow>
                      <mml:mrow>
                        <mml:mo>‖</mml:mo>
                        <mml:mrow>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mtext>*</mml:mtext>
                          </mml:msup>
                          <mml:mo>−</mml:mo>
                          <mml:msup>
                            <mml:mi>x</mml:mi>
                            <mml:mn>0</mml:mn>
                          </mml:msup>
                        </mml:mrow>
                        <mml:mo>‖</mml:mo>
                      </mml:mrow>
                    </mml:mrow>
                    <mml:mn>2</mml:mn>
                  </mml:msup>
                </mml:mrow>
                <mml:mrow>
                  <mml:mn>2</mml:mn>
                  <mml:mi>k</mml:mi>
                </mml:mrow>
              </mml:mfrac>
              <mml:mo>.</mml:mo>
            </mml:mrow>
          </mml:math>
        </disp-formula>
        <p>This completes the proof. □</p>
      </sec>
    </sec>
    <sec id="sec4">
      <title>4. Conclusions</title>
      <p>To address the strict limitation of the classic gradient Lipschitz smoothness assumption on the applicability of the PGD, this paper introduces a novel class of generalized smoothness conditions—<inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mo> ⋅ </mml:mo><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> —smoothness, establishing a more general framework for analyzing composite convex optimization problems. Under this generalized smoothness framework, we systematically derive the convergence theory of the constant-stepsize PGD algorithm and rigorously prove that: even under the generalized smoothness assumption that relaxes the classic Lipschitz gradient continuity, the constant-stepsize PGD can still achieve the exact same sublinear convergence rate <inline-formula><mml:math><mml:mrow><mml:mi> O </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mrow><mml:mrow><mml:mn> 1 </mml:mn><mml:mo> / </mml:mo><mml:mi> k </mml:mi></mml:mrow></mml:mrow><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> as in the classic smoothness scenario, provided that the function <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> satisfies <inline-formula><mml:math><mml:mrow><mml:mi> ℓ </mml:mi><mml:mrow><mml:mo> ( </mml:mo><mml:mo> ⋅ </mml:mo><mml:mo> ) </mml:mo></mml:mrow></mml:mrow></mml:math></inline-formula> —smoothness and Lipschitz continuity.</p>
      <p>However, the analysis framework in this paper relies on the core assumption that the objective function <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> satisfies gradient Lipschitz continuity. While this assumption guarantees the gradient Lipschitz continuity of <inline-formula><mml:math><mml:mi> f </mml:mi></mml:math></inline-formula> in local regions and provides theoretical support for the convergence analysis of the constant-step-size PGD algorithm, it also significantly limits the scope of application of the method: for composite convex optimization problems that do not satisfy gradient Lipschitz continuity (such as scenarios with unbounded gradients or rapidly changing gradients), the sublinear convergence rate theory of the constant-step-size PGD algorithm established in this paper will no longer hold. </p>
    </sec>
    <sec id="sec5">
      <title>Acknowledgements</title>
      <p>Sincere thanks to the members of JAMP for their professional performance, and special thanks to managing editor <italic>Hellen XU</italic> for a rare attitude of high quality.</p>
    </sec>
  </body>
  <back>
    <ref-list>
      <title>References</title>
      <ref id="B1">
        <label>1.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Shechtman, Y., Beck, A. and Eldar, Y.C. (2014) GESPAR: Efficient Phase Retrieval of Sparse Signals. <italic>IEEE</italic><italic>Transactions</italic><italic>on</italic><italic>Signal</italic><italic>Processing</italic>, 62, 928-938. https://doi.org/10.1109/tsp.2013.2297687 <pub-id pub-id-type="doi">10.1109/tsp.2013.2297687</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/tsp.2013.2297687">https://doi.org/10.1109/tsp.2013.2297687</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Shechtman, Y.</string-name>
              <string-name>Beck, A.</string-name>
              <string-name>Eldar, Y.C.</string-name>
            </person-group>
            <year>2014</year>
            <article-title>GESPAR: Efficient Phase Retrieval of Sparse Signals</article-title>
            <source>IEEE Transactions on Signal Processing</source>
            <volume>62</volume>
            <pub-id pub-id-type="doi">10.1109/tsp.2013.2297687</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B2">
        <label>2.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Cai, J.F., Long, Y., Wen, R.X. and Ying, J. (2023) A Fast and Provable Algorithm for Sparse Phase Retrieval. https://doi.org/10.48550/arXiv.2309.02046 <pub-id pub-id-type="doi">10.48550/arXiv.2309.02046</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48550/arXiv.2309.02046">https://doi.org/10.48550/arXiv.2309.02046</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Cai, J.F.</string-name>
              <string-name>Long, Y.</string-name>
              <string-name>Wen, R.X.</string-name>
              <string-name>Ying, J.</string-name>
            </person-group>
            <year>2023</year>
            <article-title>A Fast and Provable Algorithm for Sparse Phase Retrieval</article-title>
            <pub-id pub-id-type="doi">10.48550/arXiv.2309.02046</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B3">
        <label>3.</label>
        <citation-alternatives>
          <mixed-citation publication-type="confproc">Bai, Y., Wang, Y.X. and Liberty, E. (2019) ProxQuant: Quantized Neural Networks Via Proximal Operators. 7 <italic>th International Conference on Learning Representations</italic>( <italic>ICLR</italic>), New Orleans, 6-9 May 2019, 1-20.</mixed-citation>
          <element-citation publication-type="confproc">
            <person-group person-group-type="author">
              <string-name>Bai, Y.</string-name>
              <string-name>Wang, Y.X.</string-name>
              <string-name>Liberty, E.</string-name>
            </person-group>
            <year>2019</year>
            <article-title>ProxQuant: Quantized Neural Networks Via Proximal Operators</article-title>
            <source>7th International Conference on Learning Representations (ICLR)</source>
            <volume>6</volume>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B4">
        <label>4.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Vũ, B.C. (2013) A Splitting Algorithm for Dual Monotone Inclusions Involving Cocoercive Operators. <italic>Advances in Computational Mathematics</italic>, 38, 667-681. https://doi.org/10.1007/s10444-011-9254-8 <pub-id pub-id-type="doi">10.1007/s10444-011-9254-8</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s10444-011-9254-8">https://doi.org/10.1007/s10444-011-9254-8</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <year>2013</year>
            <article-title>A Splitting Algorithm for Dual Monotone Inclusions Involving Cocoercive Operators</article-title>
            <source>Advances in Computational Mathematics</source>
            <volume>38</volume>
            <pub-id pub-id-type="doi">10.1007/s10444-011-9254-8</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B5">
        <label>5.</label>
        <citation-alternatives>
          <mixed-citation publication-type="journal">Rockafellar, R.T. (2001) Monotone Operators and the Proximal Point Algorithm. <italic>SIAM Journal on Control and Optimization</italic>, 14, 877-898. https://doi.org/10.1137/0314056 <pub-id pub-id-type="doi">10.1137/0314056</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1137/0314056">https://doi.org/10.1137/0314056</ext-link></mixed-citation>
          <element-citation publication-type="journal">
            <person-group person-group-type="author">
              <string-name>Rockafellar, R.T.</string-name>
            </person-group>
            <year>2001</year>
            <article-title>Monotone Operators and the Proximal Point Algorithm</article-title>
            <source>SIAM Journal on Control and Optimization</source>
            <volume>14</volume>
            <pub-id pub-id-type="doi">10.1137/0314056</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B6">
        <label>6.</label>
        <citation-alternatives>
          <mixed-citation publication-type="confproc">Faw, M., Tziotis, I., Caramanis, C. and Mokhtari, A. (2022) The Power of Adaptivity in SGD: Self-Tuning Step Sizes with Unbounded Gradients and Affine Variance. <italic>Proceedings of the</italic> 35 <italic>th Conference on Learning Theory</italic> ( <italic>COLT</italic>), London, 2-5 July 2022, 313-355.</mixed-citation>
          <element-citation publication-type="confproc">
            <person-group person-group-type="author">
              <string-name>Faw, M.</string-name>
              <string-name>Tziotis, I.</string-name>
              <string-name>Caramanis, C.</string-name>
              <string-name>Mokhtari, A.</string-name>
            </person-group>
            <year>2022</year>
            <article-title>The Power of Adaptivity in SGD: Self-Tuning Step Sizes with Unbounded Gradients and Affine Variance</article-title>
            <source>Proceedings of the 35th Conference on Learning Theory (COLT)</source>
            <volume>2</volume>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B7">
        <label>7.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">De Marchi, A., Jia, X., Kanzow, C. and Mehlitz, P. (2023) Constrained Composite Optimization and Augmented Lagrangian Methods. <italic>Mathematical Programming</italic>, 201, 863-896. https://doi.org/10.1007/s10107-022-01922-4 <pub-id pub-id-type="doi">10.1007/s10107-022-01922-4</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1007/s10107-022-01922-4">https://doi.org/10.1007/s10107-022-01922-4</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Marchi, A.</string-name>
              <string-name>Jia, X.</string-name>
              <string-name>Kanzow, C.</string-name>
              <string-name>Mehlitz, P.</string-name>
            </person-group>
            <year>2023</year>
            <article-title>Constrained Composite Optimization and Augmented Lagrangian Methods</article-title>
            <source>Mathematical Programming</source>
            <volume>201</volume>
            <pub-id pub-id-type="doi">10.1007/s10107-022-01922-4</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B8">
        <label>8.</label>
        <citation-alternatives>
          <mixed-citation publication-type="journal">Jia, X., Kanzow, C. and Mehlitz, P. (2023) Convergence Analysis of the Proximal Gradient Method in the Presence of the Kurdyka-Łojasiewicz Property without Global Lipschitz Assumptions. <italic>SIAM Journal on Optimization</italic>, 33, 3038-3056. https://doi.org/10.1137/23m1548293 <pub-id pub-id-type="doi">10.1137/23m1548293</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1137/23m1548293">https://doi.org/10.1137/23m1548293</ext-link></mixed-citation>
          <element-citation publication-type="journal">
            <person-group person-group-type="author">
              <string-name>Jia, X.</string-name>
              <string-name>Kanzow, C.</string-name>
              <string-name>Mehlitz, P.</string-name>
            </person-group>
            <year>2023</year>
            <article-title>Convergence Analysis of the Proximal Gradient Method in the Presence of the Kurdyka-Łojasiewicz Property without Global Lipschitz Assumptions</article-title>
            <source>SIAM Journal on Optimization</source>
            <volume>33</volume>
            <pub-id pub-id-type="doi">10.1137/23m1548293</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B9">
        <label>9.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Zhang, J., He, T., Sra, S. and Jadbabaie, A. (2020) Why Gradient Clipping Accelerates Training: A Theoretical Justification for Adaptivity. https://doi.org/10.48550/arXiv.1905.11881 <pub-id pub-id-type="doi">10.48550/arXiv.1905.11881</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48550/arXiv.1905.11881">https://doi.org/10.48550/arXiv.1905.11881</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Zhang, J.</string-name>
              <string-name>He, T.</string-name>
              <string-name>Sra, S.</string-name>
              <string-name>Jadbabaie, A.</string-name>
            </person-group>
            <year>2020</year>
            <article-title>Why Gradient Clipping Accelerates Training: A Theoretical Justification for Adaptivity</article-title>
            <pub-id pub-id-type="doi">10.48550/arXiv.1905.11881</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B10">
        <label>10.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Merity, S., Keskar, N.S. and Socher, R. (2018) Regularizing and Optimizing LSTM Language Models. https://doi.org/10.48550/arXiv.1708.02182 <pub-id pub-id-type="doi">10.48550/arXiv.1708.02182</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.48550/arXiv.1708.02182">https://doi.org/10.48550/arXiv.1708.02182</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Merity, S.</string-name>
              <string-name>Keskar, N.S.</string-name>
              <string-name>Socher, R.</string-name>
            </person-group>
            <year>2018</year>
            <article-title>Regularizing and Optimizing LSTM Language Models</article-title>
            <pub-id pub-id-type="doi">10.48550/arXiv.1708.02182</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B11">
        <label>11.</label>
        <citation-alternatives>
          <mixed-citation publication-type="confproc">He, K., Zhang, X., Ren, S. and Sun, J. (2016) Deep Residual Learning for Image Recognition. 2016 <italic>IEEE Conference on Computer Vision and Pattern Recognition</italic> ( <italic>CVPR</italic>), Las Vegas, 27-30 June 2016, 770-778. https://doi.org/10.1109/cvpr.2016.90 <pub-id pub-id-type="doi">10.1109/cvpr.2016.90</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1109/cvpr.2016.90">https://doi.org/10.1109/cvpr.2016.90</ext-link></mixed-citation>
          <element-citation publication-type="confproc">
            <person-group person-group-type="author">
              <string-name>He, K.</string-name>
              <string-name>Zhang, X.</string-name>
              <string-name>Ren, S.</string-name>
              <string-name>Sun, J.</string-name>
            </person-group>
            <year>2016</year>
            <article-title>Deep Residual Learning for Image Recognition</article-title>
            <source>2016 IEEE Conference on Computer Vision and Pattern Recognition (CVPR)</source>
            <volume>27</volume>
            <pub-id pub-id-type="doi">10.1109/cvpr.2016.90</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B12">
        <label>12.</label>
        <citation-alternatives>
          <mixed-citation publication-type="thesis">Mikolov, T. (2012) Statistical Language Models Based on Neural Networks. Brno University of Technology, Faculty of Information Technology. https://www.fit.vut.cz/study/phd-thesis/283/</mixed-citation>
          <element-citation publication-type="thesis">
            <person-group person-group-type="author">
              <string-name>Mikolov, T.</string-name>
              <string-name>Technology, F</string-name>
            </person-group>
            <year>2012</year>
            <article-title>Statistical Language Models Based on Neural Networks</article-title>
            <source>Brno University of Technology</source>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B13">
        <label>13.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Xian, W., Chen, Z. and Huang, H. (2024) Delving into the Convergence of Generalized Smooth Minimax Optimization. <italic>Communications in Mathematical Physics</italic>, 235, 54191-54211.</mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Xian, W.</string-name>
              <string-name>Chen, Z.</string-name>
              <string-name>Huang, H.</string-name>
            </person-group>
            <year>2024</year>
            <article-title>Delving into the Convergence of Generalized Smooth Minimax Optimization</article-title>
            <source>Communications in Mathematical Physics</source>
            <volume>235</volume>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B14">
        <label>14.</label>
        <citation-alternatives>
          <mixed-citation publication-type="web">Hao, J., Gong, X. and Liu M. (2024) Bilevel Optimization under Unbounded Smoothness: A New Algorithm and Convergence Analysis. https://arxiv.org/abs/2401.09587</mixed-citation>
          <element-citation publication-type="web">
            <person-group person-group-type="author">
              <string-name>Hao, J.</string-name>
              <string-name>Gong, X.</string-name>
            </person-group>
            <year>2024</year>
            <article-title>Bilevel Optimization under Unbounded Smoothness: A New Algorithm and Convergence Analysis</article-title>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B15">
        <label>15.</label>
        <citation-alternatives>
          <mixed-citation publication-type="confproc">Vankov, D., Nedich, A. and Sankar, L. (2024) Generalized Smooth Variational Inequalities: Methods with Adaptive Stepsizes. <italic>Proceedings of the</italic> 41 <italic>st International Conference on Machine Learning</italic> ( <italic>ICML</italic>), Vienna, 21-27 July 2024, 49137-49170. https://proceedings.mlr.press/v235/vankov24a.html</mixed-citation>
          <element-citation publication-type="confproc">
            <person-group person-group-type="author">
              <string-name>Vankov, D.</string-name>
              <string-name>Nedich, A.</string-name>
              <string-name>Sankar, L.</string-name>
            </person-group>
            <year>2024</year>
            <article-title>Generalized Smooth Variational Inequalities: Methods with Adaptive Stepsizes</article-title>
            <source>Proceedings of the 41st International Conference on Machine Learning (ICML)</source>
            <volume>21</volume>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B16">
        <label>16.</label>
        <citation-alternatives>
          <mixed-citation publication-type="confproc">Chen, Z., Zhou, Y., Liang, Y. and Lu, Z. (2023) Generalized-Smooth Nonconvex Optimization Is as Efficient as Smooth Nonconvex Optimization. <italic>Proceedings of the</italic>40 <italic>th International Conference on Machine Learning</italic> ( <italic>ICML</italic>), Honolulu, 23-29 July 2023, 5396-5427. https://proceedings.mlr.press/v202/chen23v.html</mixed-citation>
          <element-citation publication-type="confproc">
            <person-group person-group-type="author">
              <string-name>Chen, Z.</string-name>
              <string-name>Zhou, Y.</string-name>
              <string-name>Liang, Y.</string-name>
              <string-name>Lu, Z.</string-name>
            </person-group>
            <year>2023</year>
            <article-title>Generalized-Smooth Nonconvex Optimization Is as Efficient as Smooth Nonconvex Optimization</article-title>
            <source>Proceedings of the 40th International Conference on Machine Learning (ICML)</source>
            <volume>23</volume>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B17">
        <label>17.</label>
        <citation-alternatives>
          <mixed-citation publication-type="web">Levy, D., Carmon, Y., Duchi, J.C. and Sidford, A. (2020) Large-Scale Methods for Distributionally Robust Optimization. https://arxiv.org/abs/2010.05893</mixed-citation>
          <element-citation publication-type="web">
            <person-group person-group-type="author">
              <string-name>Levy, D.</string-name>
              <string-name>Carmon, Y.</string-name>
              <string-name>Duchi, J.C.</string-name>
              <string-name>Sidford, A.</string-name>
            </person-group>
            <year>2020</year>
            <article-title>Large-Scale Methods for Distributionally Robust Optimization</article-title>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B18">
        <label>18.</label>
        <citation-alternatives>
          <mixed-citation publication-type="web">Jin, J., Zhang, B., Wang, H. and Wang, L. (2021) Non-Convex Distributionally Robust Optimization: Non-Asymptotic Analysis. https://arxiv.org/abs/2110.12459</mixed-citation>
          <element-citation publication-type="web">
            <person-group person-group-type="author">
              <string-name>Jin, J.</string-name>
              <string-name>Zhang, B.</string-name>
              <string-name>Wang, H.</string-name>
              <string-name>Wang, L.</string-name>
            </person-group>
            <year>2021</year>
            <article-title>Non-Convex Distributionally Robust Optimization: Non-Asymptotic Analysis</article-title>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B19">
        <label>19.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Cortés, J. (2006) Finite-time Convergent Gradient Flows with Applications to Network Consensus. <italic>Automatica</italic>, 42, 1993-2000. https://doi.org/10.1016/j.automatica.2006.06.015 <pub-id pub-id-type="doi">10.1016/j.automatica.2006.06.015</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1016/j.automatica.2006.06.015">https://doi.org/10.1016/j.automatica.2006.06.015</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <year>2006</year>
            <article-title>Finite-time Convergent Gradient Flows with Applications to Network Consensus</article-title>
            <source>Automatica</source>
            <volume>42</volume>
            <pub-id pub-id-type="doi">10.1016/j.automatica.2006.06.015</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B20">
        <label>20.</label>
        <citation-alternatives>
          <mixed-citation publication-type="web">Fang, C., Li, C., Lin, Z. and Zhang, T. (2018) SPIDER: Near-Optimal Non-Convex Optimization via Stochastic Path-Integrated Differential Estimator. https://arxiv.org/pdf/1807.01695</mixed-citation>
          <element-citation publication-type="web">
            <person-group person-group-type="author">
              <string-name>Fang, C.</string-name>
              <string-name>Li, C.</string-name>
              <string-name>Lin, Z.</string-name>
              <string-name>Zhang, T.</string-name>
            </person-group>
            <year>2018</year>
            <article-title>SPIDER: Near-Optimal Non-Convex Optimization via Stochastic Path-Integrated Differential Estimator</article-title>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B21">
        <label>21.</label>
        <citation-alternatives>
          <mixed-citation publication-type="web">Li, H., Tian, Y., Rakhlin, A. and Jadbabaie, A. (2023) Convex and Non-Convex Optimization under Generalized Smoothness. https://arxiv.org/pdf/2306.01264.pdf</mixed-citation>
          <element-citation publication-type="web">
            <person-group person-group-type="author">
              <string-name>Li, H.</string-name>
              <string-name>Tian, Y.</string-name>
              <string-name>Rakhlin, A.</string-name>
              <string-name>Jadbabaie, A.</string-name>
            </person-group>
            <year>2023</year>
            <article-title>Convex and Non-Convex Optimization under Generalized Smoothness</article-title>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B22">
        <label>22.</label>
        <citation-alternatives>
          <mixed-citation publication-type="confproc">Nesterov, Y.E. (1983) A Method for Solving the Convex Programming Problem with Convergence Rate O(1/ <italic>k</italic><sup>2</sup>). <italic>Proceedings of the USSR Academy of Sciences</italic>, 269, 543-547.</mixed-citation>
          <element-citation publication-type="confproc">
            <person-group person-group-type="author">
              <string-name>Nesterov, Y.E.</string-name>
            </person-group>
            <year>1983</year>
            <article-title>A Method for Solving the Convex Programming Problem with Convergence Rate O(1/k2)</article-title>
            <source>Proceedings of the USSR Academy of Sciences</source>
            <volume>269</volume>
          </element-citation>
        </citation-alternatives>
      </ref>
      <ref id="B23">
        <label>23.</label>
        <citation-alternatives>
          <mixed-citation publication-type="other">Beck, A. (2017) First-Order Methods in Optimization. Society for Industrial and Applied Mathematics. https://doi.org/10.1137/1.9781611974997 <pub-id pub-id-type="doi">10.1137/1.9781611974997</pub-id><ext-link ext-link-type="uri" xlink:href="https://doi.org/10.1137/1.9781611974997">https://doi.org/10.1137/1.9781611974997</ext-link></mixed-citation>
          <element-citation publication-type="other">
            <person-group person-group-type="author">
              <string-name>Beck, A.</string-name>
            </person-group>
            <year>2017</year>
            <article-title>First-Order Methods in Optimization</article-title>
            <pub-id pub-id-type="doi">10.1137/1.9781611974997</pub-id>
          </element-citation>
        </citation-alternatives>
      </ref>
    </ref-list>
  </back>
</article>