From mboxrd@z Thu Jan  1 00:00:00 1970
Return-Path: <owner-linux-mm@kvack.org>
X-Spam-Checker-Version: SpamAssassin 3.4.0 (2014-02-07) on
	aws-us-west-2-korg-lkml-1.web.codeaurora.org
Received: from kanga.kvack.org (kanga.kvack.org [205.233.56.17])
	by smtp.lore.kernel.org (Postfix) with ESMTP id BE810C02180
	for <linux-mm@archiver.kernel.org>; Mon, 13 Jan 2025 17:06:37 +0000 (UTC)
Received: by kanga.kvack.org (Postfix)
	id 58E136B0083; Mon, 13 Jan 2025 12:06:37 -0500 (EST)
Received: by kanga.kvack.org (Postfix, from userid 40)
	id 53E516B0085; Mon, 13 Jan 2025 12:06:37 -0500 (EST)
X-Delivered-To: int-list-linux-mm@kvack.org
Received: by kanga.kvack.org (Postfix, from userid 63042)
	id 42CE26B0088; Mon, 13 Jan 2025 12:06:37 -0500 (EST)
X-Delivered-To: linux-mm@kvack.org
Received: from relay.hostedemail.com (smtprelay0017.hostedemail.com [216.40.44.17])
	by kanga.kvack.org (Postfix) with ESMTP id 1E7326B0083
	for <linux-mm@kvack.org>; Mon, 13 Jan 2025 12:06:37 -0500 (EST)
Received: from smtpin05.hostedemail.com (a10.router.float.18 [10.200.18.1])
	by unirelay08.hostedemail.com (Postfix) with ESMTP id C0B471401B7
	for <linux-mm@kvack.org>; Mon, 13 Jan 2025 17:06:36 +0000 (UTC)
X-FDA: 83003057592.05.88BAF05
Received: from mail-ed1-f41.google.com (mail-ed1-f41.google.com [209.85.208.41])
	by imf23.hostedemail.com (Postfix) with ESMTP id C24D4140016
	for <linux-mm@kvack.org>; Mon, 13 Jan 2025 17:06:34 +0000 (UTC)
Authentication-Results: imf23.hostedemail.com;
	dkim=pass header.d=google.com header.s=20230601 header.b=JPk78EAw;
	spf=pass (imf23.hostedemail.com: domain of jannh@google.com designates 209.85.208.41 as permitted sender) smtp.mailfrom=jannh@google.com;
	dmarc=pass (policy=reject) header.from=google.com
ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=hostedemail.com;
	s=arc-20220608; t=1736787994;
	h=from:from:sender:reply-to:subject:subject:date:date:
	 message-id:message-id:to:to:cc:cc:mime-version:mime-version:
	 content-type:content-type:
	 content-transfer-encoding:content-transfer-encoding:
	 in-reply-to:in-reply-to:references:references:dkim-signature;
	bh=SXyH294O6RPeIVzRhKll3VZYS+REURZkHXdJz+ku034=;
	b=3OD8aidm1AYQ23+akn29GlllLZAe+uqAyRAeP4IN/XBuiDTEcrA4xUupyn9LVOrZnd0xzI
	xGeTUoEW6QC7BOPcRv1vn/M/jKSWiT6ILSWK2UnTjYIjYBAZUUl+nMAZtY8NcwQIzTNl/B
	G4VFEz9Me5sqALyFzQunzMTsNuEk8q0=
ARC-Authentication-Results: i=1;
	imf23.hostedemail.com;
	dkim=pass header.d=google.com header.s=20230601 header.b=JPk78EAw;
	spf=pass (imf23.hostedemail.com: domain of jannh@google.com designates 209.85.208.41 as permitted sender) smtp.mailfrom=jannh@google.com;
	dmarc=pass (policy=reject) header.from=google.com
ARC-Seal: i=1; s=arc-20220608; d=hostedemail.com; t=1736787994; a=rsa-sha256;
	cv=none;
	b=zJcnw4nFwLVIRSwGNj6uypQKyGRz0+FHkuD17Cx8JF8ruBmOZeL/5zLz54DC+ZpwhCoK0U
	iGQAlRua4nUgtaq4Xl+bJlezcYylHl9vjHY/Yc75CHaZUwes35hheFpHowKkMIwlhSLdti
	jQD/7Jbys+LvFDrj1B7TDxxaNHVMz+0=
Received: by mail-ed1-f41.google.com with SMTP id 4fb4d7f45d1cf-5d0c939ab78so12044a12.0
        for <linux-mm@kvack.org>; Mon, 13 Jan 2025 09:06:34 -0800 (PST)
DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=google.com; s=20230601; t=1736787993; x=1737392793; darn=kvack.org;
        h=content-transfer-encoding:cc:to:subject:message-id:date:from
         :in-reply-to:references:mime-version:from:to:cc:subject:date
         :message-id:reply-to;
        bh=SXyH294O6RPeIVzRhKll3VZYS+REURZkHXdJz+ku034=;
        b=JPk78EAwwK033JGsWuDwY35+zDZKC+3RZnU5Iu1M7JSgU7agIZd86aKouQxg+BDnwt
         shDzbzdlqOZ7ma/CLss/H8iNdt5LJeSHAMhmEHVLgwcKcUtDwrB4wapBfc+OKZz6ikly
         KdAAdHgup6GgfMoY1NCUajZSglboHJXu2OzlSlziZKP1PuyrOysJ4Of31rRCyXRlqPG6
         Dy22Ltgbc65isla7z0ejOqcBxyWDlMZ7q+goKqZJlr5F2xjvbMK1Q+58utUdgvBoScr0
         S2AcnXESNHpE5bzFfUS3+E7scABBTCIf1eYTk6ASo438jD7Sh1Im9uGnKaeVUxroi/XS
         Xe7g==
X-Google-DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed;
        d=1e100.net; s=20230601; t=1736787993; x=1737392793;
        h=content-transfer-encoding:cc:to:subject:message-id:date:from
         :in-reply-to:references:mime-version:x-gm-message-state:from:to:cc
         :subject:date:message-id:reply-to;
        bh=SXyH294O6RPeIVzRhKll3VZYS+REURZkHXdJz+ku034=;
        b=MTEQZorGMuZxc6ERo7aS7Ltq81dIzQRR4/J1pmtpG6dzaHIm8tPcRRu6TL4WZxMJTF
         x1Wpli0YoYGACuo2Lj03EJSL4hfF3WxsCAqT9yfly+BDwvtVhMrJitc9KDTQgViNVBEU
         qKxqmHeDNGz3OsqqyCtYv+NVye9r8CDjSe1iw+i1qvNVmP7ywiGb1HN8erpMddZiImsn
         m1GklS+EtgX988EowbXpGeoCvN1wtjyTFzi6fvi6oc/BZ1uqrBSboal0F0Jsnm/Xy9o1
         z3fnakT/QFzrtnUP/qY4rCCMbPR6POsHw0fX0MvDPaCTKxJ2pk6/o4QVh5hqTmPdSeW+
         FM1g==
X-Forwarded-Encrypted: i=1; AJvYcCUrhVMipBB9rQiBnH51kp5gWaOAsbzWAF7uyCO44VPVWSepZT+GW2QCZrHoRJpjpGME8NvSFwK0Dw==@kvack.org
X-Gm-Message-State: AOJu0Yz8L2wO7vifqcpGALFXhMXbSwKSGaGNe/b++PcUKnQX6f+OE3Co
	zCtSgFvcL/3qqtrhT3AcIcieihaueV5BaWLwh9HKWpIeBaG2CBcMt0xWpQECWptxMUGH/P65qor
	7OPKMcE4pMaokhX7hcAEVbVnjgLe6u4o+lysf
X-Gm-Gg: ASbGncsVQ8l9VvnKyUzu+JCHkQRspxTv1KAkSJcyUWyDirTY2XFpXcdcQBQxPuvLZ8I
	idF2laYqEx9xEk/vFdz0lTRyMCUQE9yDnpg998mgUln1m48zrmAl0NFqfsLGGimyc5g==
X-Google-Smtp-Source: AGHT+IE+mARr30DPzPDUanwhnV0d7sOOsUvILaxBppDwD98XyhQ9XKgUnAvE0i4X9bVxcELn7rCBW5MJ6brH4mG5AXc=
X-Received: by 2002:aa7:c596:0:b0:5d9:5a5c:f2f9 with SMTP id
 4fb4d7f45d1cf-5d9a0ce240emr263128a12.7.1736787992794; Mon, 13 Jan 2025
 09:06:32 -0800 (PST)
MIME-Version: 1.0
References: <20250112155453.1104139-1-riel@surriel.com> <20250112155453.1104139-11-riel@surriel.com>
In-Reply-To: <20250112155453.1104139-11-riel@surriel.com>
From: Jann Horn <jannh@google.com>
Date: Mon, 13 Jan 2025 18:05:56 +0100
X-Gm-Features: AbW1kvaDYARxIdg5DC1Y9qTSh0yp9OW5RrjlvOkK7DBVV7no-vPEDTvBDTUwm4I
Message-ID: <CAG48ez1QU0+Vkp2cbvTb2pLWP3X8oaz1mQxk3PEAPy07raUGBA@mail.gmail.com>
Subject: Re: [PATCH v4 10/12] x86,tlb: do targeted broadcast flushing from
 tlbbatch code
To: Rik van Riel <riel@surriel.com>
Cc: x86@kernel.org, linux-kernel@vger.kernel.org, bp@alien8.de, 
	peterz@infradead.org, dave.hansen@linux.intel.com, zhengqi.arch@bytedance.com, 
	nadav.amit@gmail.com, thomas.lendacky@amd.com, kernel-team@meta.com, 
	linux-mm@kvack.org, akpm@linux-foundation.org
Content-Type: text/plain; charset="UTF-8"
Content-Transfer-Encoding: quoted-printable
X-Rspamd-Queue-Id: C24D4140016
X-Rspamd-Server: rspam12
X-Stat-Signature: wb15wxii7ek5k3qdoxc11du87ykzhkcc
X-Rspam-User: 
X-HE-Tag: 1736787994-188123
X-HE-Meta: U2FsdGVkX19FgUseVWoBT1iaKqvtt2QLnaJzWVb6lEbRjvGwCNGHcnbLYOlfK3BTUl3hdRYr0pS7QRVgVKTTpDDxrdrG41sPAiIPX0TGWaxLdB72cUUg41MX+I6nJ2VzazfArKT8hSFwn1jIxCd4XxVtGGOYHNsPLAqSlcAi7Z+mnr4CoNyFTbXbBv7+jm2uJOywhudkV+8CtYp2sWA2kui9E8xKlRf6WZdVIuskhyG2+baYVzrF3EP5igXhXVb61IZAMNBAHdLv/rvjSHrBjxKjM2WSFbVeaZUM1Bg5IUdZHbA8H15Y7ibfmYNxGCInEjpHHHbk+2B4+fNfME5ME7OzFFZEzy7JHQGcHXXoZ/nHzNfJD7XlRG1rfrlWdvVYDsQrGEeCGuinNuLPfQGYtaxlwQyzBxaB18k2o7QfRqJjsfZtz9cMPg8qU+54sTpjDtIqDC7judzo44Z2/TtA05anxYNaq8bk/3o8QApM6iWfCoyO4JzznlW1o0cC+9knlXm+IlJTpkSBgj/gUcV5R0Su4Qn9/coar/na1fXzMrAHFwQ6MpJDGpXDnGTY8/A3jmDbMW4cmGpMn0vLidMqatblE9tVHTaDd+UIIoBtGLmHqqb849TFf8aiJRLQDop3/7f98wqA7s+kuLKZ/xtL+ktJTOt7VHqyKMjA7b57oSnsXR5reR1Sv1JY8EU3G1RmMyWf/W5on3y2V9l4LhIvxG6JfuY/f6jeYA4jkSQFMzMr9VTUGNILf2ISWnGxv+gbPcxtrzKmRrL395O4VNZbNm4AT5UfUOij8GP/94nOrWU/uSnjb/ar7MU9Nyyp6rX8gtY2rJaMmTWtPM0A0pYkb4/KA+iLF0aE1YRrLTws/huwnSON+UJ6qWnjfPuJnDYgWdG9vdbrkb39u0Cq6SqSHm8ySwALRxE1RaiGVxaG+QQ+xxu1EVkPIC2UaWE+HUDWejchuBHFnf+4f20M4Uo
 Pg6appbj
 XXmGPTuA3Rxc0pNwjThhDGMAK0GLaGnO3QwTUVk7qBCm3WM6jlV7KzfWIH2CQdIPC8fJxd5WVHrlIUDCu4/GIGH/YtAq9A5CwTdPD3kbKZqffSmNOlKcPVQflY5biZuNxTUYBOkJWQUX1nrI279nX6hHtag3XwOu2o3WhIxe3hz28sDgSjg4vIjsQGmaPQzIm4DhfntpJvrfHtIbDY7T0YK6vT4H8KvOxuhysrl+7nKC5jb2cJZ5qBc5DGXapDUpcbXllOFSb/3Kcmo9AFK7l+oXnPHRuE9TFcDKRqUtL/FDdq3kfEYIgD1OapPxh6fcDVT7isNf/GDlZDLA=
X-Bogosity: Ham, tests=bogofilter, spamicity=0.006004, version=1.2.4
Sender: owner-linux-mm@kvack.org
Precedence: bulk
X-Loop: owner-majordomo@kvack.org
List-ID: <linux-mm.kvack.org>
List-Subscribe: <mailto:majordomo@kvack.org>
List-Unsubscribe: <mailto:majordomo@kvack.org>

On Sun, Jan 12, 2025 at 4:55=E2=80=AFPM Rik van Riel <riel@surriel.com> wro=
te:
> Instead of doing a system-wide TLB flush from arch_tlbbatch_flush,
> queue up asynchronous, targeted flushes from arch_tlbbatch_add_pending.
>
> This also allows us to avoid adding the CPUs of processes using broadcast
> flushing to the batch->cpumask, and will hopefully further reduce TLB
> flushing from the reclaim and compaction paths.
[...]
> diff --git a/arch/x86/mm/tlb.c b/arch/x86/mm/tlb.c
> index 80375ef186d5..532911fbb12a 100644
> --- a/arch/x86/mm/tlb.c
> +++ b/arch/x86/mm/tlb.c
> @@ -1658,9 +1658,7 @@ void arch_tlbbatch_flush(struct arch_tlbflush_unmap=
_batch *batch)
>          * a local TLB flush is needed. Optimize this use-case by calling
>          * flush_tlb_func_local() directly in this case.
>          */
> -       if (cpu_feature_enabled(X86_FEATURE_INVLPGB)) {
> -               invlpgb_flush_all_nonglobals();
> -       } else if (cpumask_any_but(&batch->cpumask, cpu) < nr_cpu_ids) {
> +       if (cpumask_any_but(&batch->cpumask, cpu) < nr_cpu_ids) {
>                 flush_tlb_multi(&batch->cpumask, info);
>         } else if (cpumask_test_cpu(cpu, &batch->cpumask)) {
>                 lockdep_assert_irqs_enabled();
> @@ -1669,12 +1667,49 @@ void arch_tlbbatch_flush(struct arch_tlbflush_unm=
ap_batch *batch)
>                 local_irq_enable();
>         }
>
> +       /*
> +        * If we issued (asynchronous) INVLPGB flushes, wait for them her=
e.
> +        * The cpumask above contains only CPUs that were running tasks
> +        * not using broadcast TLB flushing.
> +        */
> +       if (cpu_feature_enabled(X86_FEATURE_INVLPGB) && batch->used_invlp=
gb) {
> +               tlbsync();
> +               migrate_enable();
> +               batch->used_invlpgb =3D false;
> +       }
> +
>         cpumask_clear(&batch->cpumask);
>
>         put_flush_tlb_info();
>         put_cpu();
>  }
>
> +void arch_tlbbatch_add_pending(struct arch_tlbflush_unmap_batch *batch,
> +                                            struct mm_struct *mm,
> +                                            unsigned long uaddr)
> +{
> +       if (static_cpu_has(X86_FEATURE_INVLPGB) && mm_global_asid(mm)) {
> +               u16 asid =3D mm_global_asid(mm);
> +               /*
> +                * Queue up an asynchronous invalidation. The correspondi=
ng
> +                * TLBSYNC is done in arch_tlbbatch_flush(), and must be =
done
> +                * on the same CPU.
> +                */
> +               if (!batch->used_invlpgb) {
> +                       batch->used_invlpgb =3D true;
> +                       migrate_disable();
> +               }
> +               invlpgb_flush_user_nr_nosync(kern_pcid(asid), uaddr, 1, f=
alse);
> +               /* Do any CPUs supporting INVLPGB need PTI? */
> +               if (static_cpu_has(X86_FEATURE_PTI))
> +                       invlpgb_flush_user_nr_nosync(user_pcid(asid), uad=
dr, 1, false);
> +       } else {
> +               inc_mm_tlb_gen(mm);
> +               cpumask_or(&batch->cpumask, &batch->cpumask, mm_cpumask(m=
m));
> +       }
> +       mmu_notifier_arch_invalidate_secondary_tlbs(mm, 0, -1UL);
> +}

How does this work if the MM is currently transitioning to a global
ASID? Should the "mm_global_asid(mm)" check maybe be replaced with
something that checks if the MM has fully transitioned to a global
ASID, so that we keep using the classic path if there might be holdout
CPUs?