x86: use compiler visible "add" instead of inline assembly "or" in get_cpu_info()
authorJan Beulich <jbeulich@suse.com>
Wed, 26 Sep 2012 09:49:56 +0000 (11:49 +0200)
committerJan Beulich <jbeulich@suse.com>
Wed, 26 Sep 2012 09:49:56 +0000 (11:49 +0200)
This follows the same idea as the previous patch, just that the effect
is much more visible here: With a half-way [dr]ecent gcc this reduced
.text size by over 12k for me.

Signed-off-by: Jan Beulich <jbeulich@suse.com>
Acked-by: Keir Fraser <keir@xen.org>
xen/include/asm-x86/current.h

index 8bc1fc0f94601b82ae8a5d714cfdda2b6994b1c8..bec4dbe792ce0ddb11951589379d49177e55ef9b 100644 (file)
@@ -25,12 +25,9 @@ struct cpu_info {
 
 static inline struct cpu_info *get_cpu_info(void)
 {
-    struct cpu_info *cpu_info;
-    __asm__ ( "and %%"__OP"sp,%0; or %2,%0"
-              : "=r" (cpu_info)
-              : "0" (~(STACK_SIZE-1)), "i" (STACK_SIZE-sizeof(struct cpu_info))
-        );
-    return cpu_info;
+    unsigned long tos;
+    __asm__ ( "and %%rsp,%0" : "=r" (tos) : "0" (~(STACK_SIZE-1)) );
+    return (struct cpu_info *)(tos + STACK_SIZE) - 1;
 }
 
 #define get_current()         (get_cpu_info()->current_vcpu)