<div dir="ltr"><div dir="ltr"><div class="gmail_default" style="font-size:small">Hi Joerg,</div></div><br><div class="gmail_quote"><div dir="ltr" class="gmail_attr">On Mon, Nov 30, 2020 at 4:39 PM Joerg Vehlow <<a href="mailto:lkml@jv-coder.de">lkml@jv-coder.de</a>> wrote:<br></div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">Hi Li,<br>
<br>
On 11/30/2020 9:14 AM, Li Wang wrote:<br>
> Hi Joerg,<br>
><br>
> On Mon, Nov 30, 2020 at 3:53 PM Joerg Vehlow <<a href="mailto:lkml@jv-coder.de" target="_blank">lkml@jv-coder.de</a> <br>
> <mailto:<a href="mailto:lkml@jv-coder.de" target="_blank">lkml@jv-coder.de</a>>> wrote:<br>
><br>
>     Hi,<br>
>     >> No, af_alg07 requires 2 CPUs, otherwise it'll report false<br>
>     positives.<br>
>     >> The test will pass only if fchownat() hits a half-closed socket and<br>
>     >> returns error. But IIRC the half-closed socket will be<br>
>     destroyed during<br>
>     >> reschedule which means there's no race window to hit anymore.<br>
>     But it<br>
>     >> would be better to put the TCONF condition into the test itself.<br>
>     > Interesting, I wonder if this is also true for the real-time<br>
>     kernel with<br>
>     > the threads set to RT priority?<br>
>     It looks like the test can fail even with more than one cpu. I've<br>
>     seen<br>
>     this sporadic failure on different hardware with more than two<br>
>     cores, at<br>
>     least on intel denverton (x86_64) and renesas r-car (aarch64)<br>
>     systems.<br>
>     Both with kernel 4.19 with the fix included, on the denverton<br>
>     system the<br>
>     rt parches were included and on the r-car not. The test passes<br>
>     most of<br>
>     the time, but sometimes fails with the message Li posted.<br>
><br>
>     It also seems to fail sporadically on other systems as well:<br>
>     <a href="https://bugs.launchpad.net/ubuntu-kernel-tests/+bug/1892860" rel="noreferrer" target="_blank">https://bugs.launchpad.net/ubuntu-kernel-tests/+bug/1892860</a><br>
>     <<a href="https://bugs.launchpad.net/ubuntu-kernel-tests/+bug/1892860" rel="noreferrer" target="_blank">https://bugs.launchpad.net/ubuntu-kernel-tests/+bug/1892860</a>><br>
><br>
>     Additionally I tested on qemu-x86 with 4.19 with and without rt<br>
>     patches.<br>
>     The test succeeds even with only one virtualized cpu. So either<br>
>     Martin's<br>
>     assumption is wrong or it holds only for newer kernel versions?<br>
><br>
><br>
> No, Mertin is not wrong, and you are also right.<br>
><br>
> They are totally two different issues of af_alg07, the test on 1CPU<br>
> should be fixed with TCONF. But the fail with aarch64 is more like a<br>
> hardware issue, Chunyu has a drafted patch to add init delay value for<br>
> such a system.<br>
I think you misunderstood something. I see random fails with "TFAIL: <br>
fchownat() failed to fail, kernel may be vulnerable" on both x86_64 and <br>
aarch64 with more than one cpu core (4 for x86_64 and 2 or 4 for aarch64).<br></blockquote><div><br></div><div><div class="gmail_default" style="font-size:small">Well, seems I was <span style="color:rgb(51,51,51);font-size:14px">somewhat arbitrary on this problem </span>a moment ago<span style="color:rgb(51,51,51);font-size:14px">.</span></div><br></div><div><div class="gmail_default" style="font-size:small">Probably I was missing the 4cores fails on x86_64 you mentioned, we just </div><div class="gmail_default" style="font-size:small">observed that FAIL on 1CPU x86_64 and hpe_moonshot(aarch64) so far.</div></div><div class="gmail_default" style="font-size:small">The tentative conclusion of our debugging result:</div><div class="gmail_default" style="font-size:small"><br></div><div class="gmail_default" style="font-size:small">  1. FAIL with 1CPU KVM x86_64 is false positives</div><div class="gmail_default" style="font-size:small">  2. FAIL with hpe_moonshot aarch64 is caused by cache line design</div><div> </div><blockquote class="gmail_quote" style="margin:0px 0px 0px 0.8ex;border-left:1px solid rgb(204,204,204);padding-left:1ex">
<br>
I see no error ("TPASS: fchownat() failed successfully: ENOENT (2)") on <br>
single core qemu-x86. This is why I think Martin's assumption may be <br>
wrong. If it was right, it should never succeed on a single core system <br>
right?<br></blockquote><div><br></div><div class="gmail_default" style="font-size:small">Hmm, it's hard to say never, it is also possible to create a race window on a single-core system.</div><div class="gmail_default" style="font-size:small">Anyway, we need to do more investigation.</div></div><div><br></div>-- <br><div dir="ltr" class="gmail_signature"><div dir="ltr"><div>Regards,<br></div><div>Li Wang<br></div></div></div></div>